洛阳证券公司联盟

从入门到实操!一文带你读懂当下最火爆的量化交易

终极经纪人2021-11-20 10:04:07

*作者:邝镇原

*执业证书编号:S1080616080005  


导读


说起量化交易,你脑海里是否会浮现这样一个画面:一间高科技搭建的交易室,上百台电脑显示屏飞速跑着各种数学模型,投资交易以微秒计的速度高深莫测地计算着?诚然,普通投资者眼里,量化交易可能意味着复杂模型、高频交易、专业程序,且仿佛离我们很远。这些固然是量化交易的特征,但其实离我们并不遥远,事实上,我们每天都不自觉地在使用着量化。比如当你用某个或某些条件去判断是否要买卖某只股票或者如何买卖时,就是量化思维的一种表现。


 所以量化投资并不高深,只是大多数量化投资者在探讨量化交易时多数会以复杂的策略编程为切入点,无意间为量化交易披上了一层神秘面纱。本文将尝试以通俗易懂的语言配以浅显直白的实例,为量化交易做一个简单“素描”,揭开他的神秘面纱,即便是毫无基础的小白也能轻松理解。


作为一种专业化严谨化去人性化的投资方式,量化策略可以帮助投资者克服交易中人性的弱点,获得相对更好的投资收益。希望这篇文章,能引起你对量化交易的兴趣。

量化因子到底是什么?


我们先给量化交易下一个广义上的定义,量化投资其实是一种理性的思维方式。只要着眼于真实数据,理性地运用逻辑分析和归纳统计来得出一些市场的观点和规律,并据此制定和执行明确的交易策略, 都可以称之为做量化交易。我们在投资时常常会无意识运用量化的方法来指导自己的决策,甚至本来就已经用着量化的思维指导自己的交易。当你在选择股票和判断交易时机时,往往就用到了“量化因子”。


所谓因子,就是选股条件——人为抽象出来的各种特征或看待事物的角度。这些特征和角度往往基于经验的总结。举例来说,如果让我们从一群人中挑选出可能跑得快的人,基于经验,多数人会挑选“腿长”、“健壮”的人,所谓的“腿长”和“健壮”就是两个因子。


多数情况,我们感知“腿长”,“健壮”可能会通过眼睛看、凭经验判断;而有些人则可能会广纳样本并通过数学模型统计工具厘定“腿长”和“健壮”的尺度。前者我们且称之为经验派,那对应的,后者就是量化派了。


在股市里,为了尝试总结出什么特征的股票能在未来取得高收益,我们同样会抽象出各种因子。如技术分析的投资者可以通过K线形态、每日的交易价格、成交量、换手率等归纳出一些因子。当你在按照技术指标金来交易时,其实就是在使用量化的因子思维进行决策,你相信这类技术因子能起作用。


基本面投资者在分析企业家背景、企业财务状况、股权结构时,会使用很多基本面信息的因子,相信企业的价值性、成长性能有效助推股价。宏观投资者自上而下地根据国家存贷利率、货币数据、行业生产数据等作出决策时,也是在假设宏观经济类的因子能预判出市场的好坏。


这些都是因子与因子的运用。


无论持有哪种信念的投资者,都会有他看待市场的角度,有他自己分析判断市场常用的因子。只要运用得当,因子之间没有绝对优劣之分,只有角度之别。大数据分析并不会因为比基本面分析更酷炫更高科技而更有用,基本面投资也并不见得因为对企业财务状况更了解就显得比技术分析更理性。一切只取决于你对因子本质的理解是否到位,运用因子时是否足够精确和严谨。


如何让因子的运用最完美?

    

先学会制定一个完整合格的量化策略


有了因子,我们相当于有了制造食物的原材料,接下去就是按什么配方,用什么样的机器去加工出食品。好比无论中餐还是西餐,你做菜的时候心里总会有个食谱。   

 

投资亦如此。只是在投资的领域里,所谓的配方,就是一个交易策略。没接触过量化策略的投资者,会潜意识地使用各种因子搭配出一个模糊的交易策略,用心中这杆秤粗略地评估给予哪些判断条件更大的权重。比如,当一个投资者决定入场买卖股票时,他很可能会看一下公司当前的消息,然后再看一下公司的经营情况,考虑下公司的行业在未来是否有发展空间,最后再根据公司的走势图决定是否买入。那么这个模糊的配方,就揉杂了多种原材料,而且这个配方中,占考量权重最大的是走势图。


虽然有了因子与交易策略的模糊概念,但在实际执行中,我们的交易策略、因子选择与组合常常会因为外部因素、市场情绪、个人认知非理性偏差等随意改变,导致虽然是相同的食材,但每次煮出来的食物咸淡不一,口感质量时好时坏。量化策略要做的事,就是排除主观的模糊与偏见,客观地了解市场过去的历史,通过归纳选择出选股因子后,用前后一致、定量精确、可重复执行的原则分配权重,指导选股。排除人为情绪的干扰。


一个完整合格的量化交易策略,应该明确地包含标的筛选条件、买卖条件以及买卖仓位三大要素。接下来我们具体来谈一下各类量化策略。


常见的量化策略有哪些?

1. 单因子策略


单因子量化策略,是最简单、最容易执行的量化策略。在这个策略中,标的筛选、买卖条件和买卖仓位,基本由一个核心条件决定,或者说,这个策略所带来的投资收益,大都源于一个核心条件。构建一个单因子策略,可以让我们非常直观地,看到每一个因子在市场里的历史过往表现。


由于量化策略的定量准确和可复制性,我们可以在真实历史里模拟出这个策略的历史投资收益曲线,也就是假定从历史某天起就一直使用这个策略炒股的账户总资产变化曲线。


这里先给大家补充下投资收益构成的基础概念。投资的收益一般分解为两部分,一部分是你所参与的市场或你所选择的参考范围的均值回报率——beta,另一部分是你相对于均值回报率的相对收益——alpha。很显然,假如相对收益为正数,则意味着我们的投资收益超过了你的对比范围的平均值。每一个量化策略,都代表着一个投资的角度和方向,都有它的历史收益曲线,假如这个量化策略的收益曲线超越了市场均值,那我们就可以认为这个策略在过去那段时间是相对优秀的。


那么,整个中国股市的平均回报率曲线是怎样的呢?我们可以用历史全市场股票的平均每日涨跌幅来生成一条市场平均回报率曲线。这条曲线表达的是假定你把全市场所有股票等权买了,并且每天都对持仓比例进行等权平衡的累计回报率。


*如下图(不考虑停牌、涨跌停无法买卖的情况)。

* 数据来源:笔者自行整理


2007年1月4日起至2018年3月,从1增长到10,收益为10倍,这就是中国股票市场近12年的近似平均回报率。

 

举一个具体的单因子量化策略——股票市值。来看看假如一直使用这两个选股条件选股,能获得怎样的历史回报率曲线,能否成功超越市场的均值回报。


根据策略三要素,标的、买卖条件及仓位。确定如下策略:


标的筛选条件:剔除掉上市不足30天的次新股、ST股后,选出前一天收盘后全市场总市值最小的前50只股票,构建交易范围。


买卖条件:每个交易日开盘买入交易范围内所有股票,卖出不在该范围内的所有股票;


买卖仓位:限制为每只股票等权买入总资产的2%。


同时,每次调仓设置了来回千分之四的交易成本,并且根据历史停牌、涨跌停不能买入卖出的情况作了调整,不考虑市场真实容量及交易对市场的冲击


来看看假如一直使用这两个选股条件选股,能获得怎样的历史回报率曲线,能否成功超越市场的均值回报。

 *坐标系:等比坐标 数据来源:果仁网。

 

上图是这个小市值量化策略的历史模拟收益曲线,2007年1月4日至2018年3月16日,回报率为14279%,也就是12年143倍。如果只持有排名最小的前10只的话,这个回报率达到了惊人的几百倍。不过,近一年来,也就是2017年3月到2018年3月,最大跌幅曾高达40%。这是一个名副其实的高风险、高收益量化策略。显然,它的历史模拟回报率远超历史市场平均回报率,在过去的十几年里,这个选股条件总体上是有效的。


事实上,我们每天都在关注单因子策略。从广义上来说,我们平时打开行情软件看到的上证指数、沪深300指数等,就是一个个以市值为核心的单因子策略。这个指数从发布日至今的表现,近似的就是这个单因子策略的历史投资收益曲线(忽略分红除权和交易因素)。当然,对于成分股,官方还有一些限制条件来做标的过滤,必要时会根据市场现况单独剔除某些股票等。


所以,在股海遨游的投资者朋友们,量化投资其实就在我们的身边,你感觉到了么?


2. 多因子策略


每个量化因子,都是市场的一个方向,都能提供一个不同的角度观察市场。选择哪个因子来组建量化策略,本质是在复制市场这个方向的收益,可以深我们对市场的理解,使我们对这个市场的了解更全面。


但正如我们不会只用一种原材料做菜,在实际的投资中,为了将风险分散,不把鸡蛋都放在同一个篮子里,我们往往不会只使用一个条件选股,只使用一个单因子策略。更多的是在对市场常见的因子作一些直观的统计后,根据自己的喜好,挑选出想用的因子来混合量化策略。用多个因子来组建的量化策略,就是多因子策略。


做一个多因子策略最简单的方式就是,选几个单因子策略,给它们分配不同比例的仓位,然后合并起来即可。这里简单介绍一下组建多因子策略的推荐步骤。需要注意的是为了使得混合因子能真的起到风险分散,角度更全面,层次更丰富的效果,多因子策略里的因子之间,相关性一般要求小一些。


第一步,先粗略地看看市场历史中一些常见因子的回报率情况。

 

*数据来源:果仁网

上图是近3年来全市场常见单因子策略回报率排序的前十名。上文用于举例的两个单因子也在列表中。为了讲解方便,我们就选取小市值和动态市盈率两个单因子策略来合并一个多因子策略。


第二步,用这两个因子分别组建单因子策略,然后合并构建一个多因子量化策略。


我们按上文量化单因子策略的设计步骤,分别生成等权买入市值最小的20个股票、等权动态市盈率最小的10个股票这两个单因子策略。策略内部设置开盘按交易范围调仓。


随后,令这两个单因子策略分别占账户总资金的1/2仓位,整个账户共运行2个单因子策略,持有30个股票。


实际筛选过程剔除了上市不足30天的次新股、ST以及银行股,并考虑了来回千分之四的交易成本以及涨跌停、停牌导致不能交易的情况,不考虑市场容量及交易行为对市场的冲击。


这个合并后的多因子量化策略历史收益率曲线如下图:从2011年1月1日至2018年3月16日,获得了1049%的回报率,也就是7年11倍。


 

(坐标系:等比坐标,数据来源:果仁网)

  如果从2007年1月4日开始计算,这个收益率是11687%,12年近120倍。

*坐标系:等比坐标,数据来源:果仁网

再来看看这个混合出来的多因子策略逐年表现:

 

*数据来源:果仁网

除了2008年一年亏了近50%以外,绝大部分年份都是正收益,2007、2009、2014-15三段牛市,为总资产贡献了大部分收益。


混合而成的这个多因子策略与上文介绍的小市值单因子策略相比,两个策略持仓股数都在三五十只,也都取得了10多年过百倍的历史收益,但小市值单因子策略波动巨大,近一年就亏了近40%,而且其与收益的相关性波动也大,经常性地罢工。


相比之下,多因子策略可以让整个账户不要太依赖某个方向,相当于给一份工作找了几个备岗,某个因子罢工请病假的时候,剩下那几个照样能让整个工作正常流转。这样一来,虽然工作效率可能是降低了,公司可能也多了些冗员,但起码运转起来更平稳,更能抵御事况的变化。


最后要说明的是,上面的历史回报率计算没有考虑市场的真实容量以及买入量对市场的影响。考虑到市场容量,上面提的一些策略只持仓几十个股票想真的获得上百倍收益率很难,因为你一只股票可能一下买不到那么多。一只股票你一笔买几万元可能问题,但如果要一笔买几十万,很多股票可能就有流动性问题了。你必须分笔买入,这会导致交易成本和交易滑点的增加。并且,在实际当中,如果对某个股票发生大量的买入行为,本身就会影响到它的走势。也就是说,上面的历史回报率计算会虚高,但大体上没有方向性错误。


如何高效执行量化策略


量化交易三兄弟,量化因子、策略制定及程序化交易已经为大家介绍完两个了。接下来就聊一聊如何执行策略。在我看来,高效地执行制定好的策略比制定策略可能更重要,因为投资的朋友都知道,这是一个逆人性的过程。这样看来,选择一个执行你的量化策略的平台就显得尤为重要了。这就是有了优质原料与食谱,还得选择一个好用的工具来加工材料,才能让三者完美结合。一般券商给客户提供的行情交易终端,大都只支持简单的手工交易,就好比自己烧柴火炒菜一样。如果只是日常使用,大体也能满足需求。


但如果你的策略比较复杂,涉及到多只个股同个时间的定量买卖,并且希望自己不用动手,那你就需要一个智能料理机了。自动执行设定好的交易策略的方式,让交易程序化。业内部分券商给客户提供了支持程序化交易的平台,比如第一创业证券就有多个不同风格和特性的程序化交易平台供客户使用,客户可以根据实际需求选择一创量化通、一创聚宽等不同平台


为什么要选择量化?


通过上面的解释,我们可以看到,量化投资不是一种独特的交易流派,只是一种借助历史数据和归纳统计逻辑完善我们分析思路的态度。无论你是价值派、技术派、消息派还是低风险投资派,无论你经常做的是股票、债券、商品还是期权期货,其实都需要量化。相比于靠个人经验作决策的投资者,量化投资者手中的武器就是市场证据和理性。


用好量化投资,除了能排除决策中的主观偏见,克服心理障碍,帮助投资者做到知行合一等好处以外,它还能大大缩短投资者的研究时间。A股市场有3000多只股票,巨大的股票数量给基本面和技术面投资者的分析带来很多困难。任何人都有能力圈,时间都有限,如何能够迅速把握住市场不同时期的特征?量化通过因子的概念将3000只股票重新归类为不同的因子,投资者通过观察不同因子的历史表现,就可以起到一叶知秋的效果


不同的因子,其实就是观察市场的不同角度,用不同的因子来构建我们的持仓,其实就是复制市场不同角度的表现。回报率高的角度,就是所谓的风口、潮流。有了因子的思维后,我们不需要去判断每一只具体的股票未来会如何,取而代之的是去判断哪些因子、哪些角度将会是未来的潮流。


我们知道,其实很多投资大师终其一生都用同样的投资思路来做挖掘股票,从量化因子的角度看,他不过是一直追随着某些因子,而这些因子一直有效。这些人其实都是顺着时代潮流的幸运儿。正如美国“债券之王”Bill Gross所说,“每个投资大师,像巴菲特、索罗斯,还有我自己,都受惠于这个伟大的时代。一些投资者承担了一些风险,加了一些杠杆,获得了一些回报,便被冠以“大师”的称号,殊不知他们只是比较幸运而已。”


结语

在聊量化策略时,提到我们可以通过观察不同的单因子量化策略历史收益曲线,来粗略感受一个因子的历史有效性。但实际执行并非这么简单,因为就算是一个因子,利用的方式也有多种。上面我在构建策略的筛选条件时,都是将选股因子从小到大排,如果反过来排,又是什么结果呢?有没有可能其实某段时间反过来排收益更高?又或者这个选股条件其实跟回报率并没什么直接关系,你所选的这些股票能获得这样的回报率是否仅仅只是碰巧如此而已?


想回答这些问题,我们必须要研究下因子和收益率的关系。这就涉及到因子的信息系数(IC,Information Coefficient)图了,通过IC图可以更全面直观地观察到市场历史,了解我们所选择的因子的特性,从而提高策略准确性与投资收益。关于因子信息系数,我们将在下期内容详细展开。





*免责声明:文中观点仅作分享,不代表本微信平台观点,不构成投资建议。市场有风险,投资需谨慎。