打开微信,扫一扫登录

散户的量化投资之道

雪球   2018-12-13 16:09 8312 0

嘉宾张翼珍演讲,侧重讲作为一个散户如何进行量化投资,在讨论上跟持有封基老师路数完全不同。

  8月20日雪球CLUB量化专场,以下为嘉宾张翼珍的演讲全文:



  各位好,很高兴在量化专场跟大家分享,我侧重讲作为一个散户如何进行量化投资,在讨论上跟持有封基老师路数完全不同。


  像以前一句明言所说,认识你自己。


  我们作为散户进行量化投资的时候优势和劣势到底在哪里,这个问题我们首先要明白之后,你才能知道你在做投资的时候,你有什么相同或者是不同的地方。


  散户的劣势第一点首先是数据的有限性。


  我做财经记者的时候,不可能像投研的研究者有那么好的条件,但是我必须感谢报社给我们创造的投研环境条件非常好。


  那时候报社给我配备的数据终端大概有这些,一台彭博终端,一年的年费是20万。


  一台是万得终端,当时的年费可能是三万到四万。当时还会根据我们的需求申请,比如老的投资人知道一段时间内上交所出过的TopView数据,那个数据一年年费大概也是三万左右,那时候报社有钱买。


  所以差不多一年给我配的数据终端开销差不多30万,比我当时收入还高。这样的条件是我作为政券记者获得的数据条件,但是有多少散户能享受到这样的条件?可能很多散户甚至股票账户都未必有30万,更不用说一年可以亏30万或者是花30万的投研成本。


  现在时代在进步,应该说整个市场环境越来越好,有越来越多的廉价的数据来源,可能你一年花几千块钱就可以获得比较好的数据渠道。像我自己用的是比较便宜的Choice数据终端,但是尽管如此也是几千块一年。


  散户不仅是数据有限,接入市场的通道也有限。大家应该知道,很多专业投资者会买A股交易席位,或者是会有海外市场、期货等等,非常多的渠道做交易。

  但是对我们很多散户来说,留给你的也就剩下A股这样一个条件,很多散户债券乃至分级都买不了,更不要说海外投资,也不用说A股的特殊交易席位,这些个都是你的劣势,这样情况下,类似高频或者是多资产的复杂的策略,其实是不适合你的。


  第二个限制是散户资金量有限。


  量化投资中最基本的是你复制一个指数,对散户来说也不是不可能的事情。刚刚黎总说到沪深300,300个股票你全都买的话,即使我们按照每个股票十块钱计算,你买一百股平均是多少钱。


  对很多人来说已经是很难完成的任务,更不要说你真正进行沪深300指数的时候必须按照权重来做,对你整个资金量要求更高了。量化投资中很大的一块是因子选股策略,你可以看到他们某些金融工程分析师做的研报,他动不动让你一百个股票,买一百个股票对很多人来说也是一件资金量非常大的事情,这对散户来说也是非常大的限制。


  还有一个限制是散户没有投研团队、IT团队做支持,其实在基金公司,你可能不需要自己会写代码,依然可以做量化的回测,因为你手下有初级分析师,甚至有IT人员可以帮你解决,包括数据的清洗都不需要你自己操心。


  但是作为一个散户你没有这样的优良的环境,所以在这样的前提下,很多复杂的模型不适合。在这样的前提下,我们需要做的是一些有散户特色的量化投资。


  说完劣势我们要说散户的优势,刚刚持有封基老师提到资金量小,这是巨大的优势,我觉得的确是。


  如果你看一些关于量化投资的回测的研究报告或者是学术论文你会发现,他们做回测的时候,他们为了验证一个策略的有效性,他按照1%到1.5%一次的交易成本测算,有时候经常会说这个模型本来挺好的,但是一旦加入了1%的交易成本,这个模型就失效了,可能这个策略不是太靠谱。


  但是作为一个散户你会想,我的交易成本哪里有1%,这是其实就是散户跟机构的区别。


  刚刚景顺长城也谈到他的沪深300模型市场容量的问题,他的模型可能会好一点,有比较大的市场容量。但是大家会注意到过去一段时间内,某些量化基金可能到了一百亿之后业绩快速出现了滑坡,因为对他们来说可能买的都是小盘股,一百亿下去很容易造成市场冲击。


  在这样的前提下,有时候市场冲击真的可能是1%,所以的确很多模型会因为这个原因失效。但是对散户而言,其实整个A股整个投资市场对你来说近乎于一个理想化的无摩擦的状态,你不用考虑你买进去的股票对整个市场价格的波动。


  一般情况下不要买那种一天成交只有一两百万的创业板股票,你很难感受到市场的摩擦。这样无摩擦的情况下你做投资,你先天比大多数机构投资者幸福很多。因为他们要考虑的是如何减少对市场的冲击,所以你会发现很多量化投资很重视算法,把一个大单分解,减少对市场的冲击。


  这些东西对于普通散户来说,因为你的资金量足够小,几乎不需要考虑这个问题。对机构来说不合适的策略,对你而言,可能依然是一个非常好的策略,这个问题在后面我还会继续讲到。


  第二点对散户最大的优势在于,你因为是为自己做投资,所以你没有一些做机构投资者会受到的局限。


  什么局限是机构投资者会有的?


  其实大多数时候是我们作为基金持有者会去考量的。比如说一个基金老是跑输,可能跑输一个月两个月还行,三个月可能持有人就有压力了,还有回撤,有的机构投资者只能够接受3%到4%的回撤。


  这些变态的要求叠加在一起之后,很多的机构投资者被迫做出一些也许不是最优化的选择,只是为了应付减少持有人的焦虑。在这样的前提下,他们的投资会比散户有更大的束缚。对散户而言,有时候你自己想明白了是追求收益最大化的,甚至做好可以接受30%的回撤准备,如果你的模型觉得水平差不多,你就可以接受它跑。


  但是对很多对冲基金,特别是私募的,他们绝对不能拿这样的模型做,因为你可能到15%,已经到强制平仓线了,这是做散户量化投资上的优势。


  因为这个原因,我推导出我个人偏好和持有封基老师不一样,我更多喜欢做的是动量的交易,而且是偏指数化的。其实我觉得在量化投资这块有很多大类别,常见的是价值投资、动量投资包括携带交易。


  对散户来说,我觉得价值投资不是完全不行,但是一个很大的问题是回撤不好控制。


  第二个就是说价值投资很多理念先天是基于投资股票来的,因为你在投资外汇、商品的时候很难严格地做价值投资的分析。因为至少在股票上,我们还有看似科学的DDM模型做估值,虽然这个模型我觉得更多偏向于艺术,但是你最起码有一个定价模型在。


  但是在外汇或者是商品上,我们学术上没有严格的定价模型的。如果你都没有办法做理论的定价,谈什么价值投资。我觉得价值投资在这块上有先天的缺陷。动量是我喜欢的模型,后面会详细讲。


  携带交易大家做外汇的很多人会知道,就是买入高息的外汇品种,然后做空低息的外汇品种,类似这样的方法。但是这样的方法在中国外汇条件下是没法做的。


  这是在海外非常流行的策略,在中国暂时你用不了。


  说到动量投资,其实对很中国老股民来说,有一个非常熟悉的近亲。虽然那个近亲被鄙视了很多年,那就是技术分析。


  我想很多老股民在入市的时候,多多少少看过技术分析的书,学过一堆技术指标,很多人过了很多年以后发现并不怎么好使。


  所以2005年、2006年那个时代,大家突然知道了价值投资,或者说那时候所有基金公司都在讲价值投资,都在讲巴菲特、滚雪球,那个时候是价值投资最最当红的时候,因为大家在国内多数人都不知道量化投资的概念,那个时代价值投资是主流的,技术分析被认为是江湖术士,就是骗子们玩的那套,这是中国A股发展中的一个很特殊的时代。


  但是过了几年大家知道了西蒙斯这样的人,慢慢有些改观了。


  我觉得从某种意义上说,动量投资和技术分析是有一定的近亲的。比如动量投资中很常见的一个回测,你看学术界很多回测的基本模型,可能是某个股票或者是某个指数超过了一百日的均线,你就买入,低于了你就卖出,这个对技术分析的人来说太熟悉了。


  技术分析哪个人没有玩过均线的交易系统,而且很多人以前玩的更溜,一根不够玩根,两根不够玩三根。其实一定程度上来说,动量投资和技术分析有很多相近之处,只不过在于会把它模型化、量化,可能在具体的操作层面上会有一些区别。


  虽然在中国一度你说你是研究均线的会被人看不起,但如果你留意这二三十年真正学术界对于投资这块的研究的话,我指的不是你们通过报纸上和某些公司的基金宣传上看到的,你会发现所谓的动量效应。


  momentumeffect,这个其实是被研究的非常多的,甚至是一个主流的显学,不是我们以为的江湖骗子研究的东西。其实很多大学里的教授也在研究这个问题,包括前两年刚刚得诺贝尔奖的尤金·法玛,他提出了三因子模型,包括了大小盘和价值成长这个模型,其实他的合作者肯尼思·弗兰奇(KennethFrench)依然在他的官网上持续发布三因子的数据,但同时他也在发布第四个动量因子的数据。


  可见在学术界动量因子是堂堂正正的显学,但只是在我们大陆的环境下,在前两年量化投资没那么热的时候,被我们很多人忽视了。尤其我们大多数人都谈时间的玫瑰,谈买股票一定要坚持的理论下,其实很多人忽视了动量的价值。


  我觉得动量用一句老话来说核心是追涨杀跌,和普通追涨杀跌股民有什么区别?


  动量的核心是量化投资,它是把整个追涨杀跌的思路全部给量化了,什么时候该追涨,什么时候该杀跌,以什么指标判断,一旦判断完之后绝不留情地去操作。我觉得这是量化投资和普通散户做分析完全不同的地方,而且动量你是做了大量回测确保这个模型具有一定可靠性才能做的。


  为什么说散户做动量


  其实是很简单、很有意义的事情。


  核心问题在于你一个动量的投资可以简单到你只是对一个指数进行了操作,这个买卖相对来说是非常简单的。比如说随便找个指数基金一块两块的,然后你买个一百股,也就一百多块钱。


  但你不要用最低佣金是5块的券商,这样情况下你的入门门槛非常低,我指的是载体和资金面角度。其实最简单的动量投资策略可以简单到让你觉得像一个智障一样的思路,就是我这里说的,这是学术界非常多使用的动量的基本模型。你到每个月月末看看你想买的交易品种,过去三个月它是上涨的,你下个月继续做多。过去三个月是下跌的情况下,在不能做空的前提下,你就空仓。这个模型相比以前股民研究了非常多的技术分析的书,这个模型简单到让人难以置信的程度。但其实这个模型效果真的不差,其实有很多回测你可以去看。包括非常多的对冲基金也会做这样的回测。


  在美国有一个非常著名的量化基金的投资叫大本营,大本营的当家人阿斯内斯,他是尤金·法玛的学生,他的博士生。


  当年研究的也是三因子,但是尤金·法玛是一个愿意做学术的人,而阿斯内斯觉得学术不太好玩,所以他学到了尤金·法玛的那套三因子之后,他就选择做了对冲基金。


  但是因为他本身师承很好,在赚了很多钱以后他业余爱好就是写论文。前面黎总给大家看的右手边有一张像魔方一样的图,那张图来自于一本书叫《预期收益》,作者是和阿斯内斯非常好的关系,他们一起写过论文研究怎么做量化投资。你看阿斯内四好多论文会发现,他对好多回测的测量是基于我刚才讲的简单的模型,过去三个月上涨有做多,下跌就做空。


  他会发现即使那么简单的模型,我在不同的学术环境、不同的市场、不同的品种下依然非常有效。所以我觉得其实对于散户来说,动量是一个非常简单,但是在学术界地位不低的操作模式。


  简单到任何人其实只要记住这句话,回去可以直接操作的模型。但是复杂到你会发现在过去二十几年里面,大家写了非常多的论文讨论,怎么用同样的思路做出不同的投资结果。


  动量模型前面讲的只是最简单的风格,为什么包括阿斯内斯在内的人可以写出上百篇论文?你会发现他把这个模型扩展化了。比如说我做三个月回测效果怎么样,6个月回测怎么样,12个月回测效果怎么样。


  因为做量化投资的时候大家最担心的事情是过度优化,有的时候可能你选了一个参数三个月是靠谱的,到四个月模型就崩溃了。到底靠不靠谱?这个被称为鲁棒性,我们要求不能因为初始参数小小的一点波动,就导致整个模型的崩溃。


  所以你会发现许多人会不断用各个时点去测,用三个月、六个月、十二个月测,看动量模型到底靠不靠谱,事实结果是都很靠谱。然后他们会测品种,看到底是哪个品种最好,是不是在某些品种中会失效,发现股票、债券、商品、外汇,所有这些投资市场都存在动量效应,这个效应是可以长期存在的。


  在这两个变种之后,关于动量投资还有一个新的变种,就是从绝对动量到相对动量。刚刚我们前面讲的是基于一个品种,它过去三个月上涨你就做多,下跌你就做空或者是空仓。


  但是所谓的相对动量是什么,可能同时看三四个品种,看谁跑的最好。如果说我两个品种,我可能只选择每个月月末买过去三个月表现最好的品种,这样的投资方法会称为相对动量。


  如果大家买过雪球的蛋卷二八平衡,或者是我自己用的28模型,就会知道这是一个相对动量的做法,我选的是两个品种,中证500和沪深300,选的参数是以周来判断的,四周表现做一个相对动量。这样的动量其实你只需要不断拓展,把它做的非常复杂。


  包括可以放入黄金,放入债券,放入商品等等不同品种,这样的模型可以很快地把它从单纯的A股扩展到全球资产轮动的模型,有这样一个模型的话,你可以做一些回测,你会发现这些模型在非常多的时间里面可以让你规避甚至包括2008年的全球的次贷危机这样的市场。


  甚至哪怕在A股这个环境下,如果你是有国债ETF或者企业债这样的品种和上证指数做一个相对动量的轮动的话,其实大体在2008年你可以规避A股下跌,甚至可以赚钱。


  当然持有封基老师觉得这是不是一个运气,其实在相对动量中我们不认为是运气,其实模型就是这样判断的,在一定时间内债券比股票好的时候我们应该买债券。这其实是一个量化模型可以算出来,可重演的东西。


  动量投资其实只是诸多量化投资中的一个成本,这样的一个模型你可以预期他长期表现不错,但是你不可能要求他年年是不错的,比如说其实在过去一年到一年半的时间内,全球动量投资表现其实并不算太好。这里有一个指数大家有兴趣可以看,这是美国一家机构做的,他是对动量投资在全球的表现做了一个指数。


  大体判断告诉你类似我们说的过去三个月上涨持有这样一个模型,在全球范围内过去一段时间表现是多少。过去五年表现不怎么样,2.54。但是从长期来看,差不多到8.58的水平。


  因为他是做了很多基于波动性的调整,他是对冲基金开发的指数。所以长期来看,八点几的收益已经是相当不错的。因为对基金来说,它是可以通过加杠杆的方式继续加大收益。的确过去三年表现非常糟糕,0.96。包括28也是一样的道理,他曾经有非常好的时候,但是这两年因为市场处于无波动的状态,动量模型这两年处于低潮期。


  这个就是说其实你做任何一个量化模型都无法避免,就是任何因子都有高潮和低谷的区分。像做价值投资的人,前两年创业板热的时候,价值因子一塌糊涂,但是到今年可能价值因子又回来了。


  前两年很多人做小盘股因子的量化投资,赚的非常多,但是今年已经全部打回原形了。其实动量也是一样的道理,动量是追涨杀跌的模型,他在2008这样大的次贷危机的波动市场内,其实表现非常好。但是这一两年,尤其在比如说量化宽松的退出期,整个市场缺乏足够多的波动的前期下,不会是一个特别好的模型,尤其是在我预示资产能动的前提下,在这两年只有美股表现非常不错的前提下,先天就不会是特别好的模型。


  但是三十年河东,三十年河西,动量作为量化投资中的基本大类,每个人都应该了解一下,尤其对散户来说,配备一点是比较好的。这个是按年区分的表现,其实大家可以看到2016年是非常糟的,是13.59亏损,2015年也比较差,但是前面几年不错,比如2008年还赚了7点几,这是动量投资的特色。


  其实我觉得动量投资单纯模型有很多局限性,但是如果你还想获得收益的话,有不同的方法。比如说因为我们前面讲的动量是一个纯做多的不做空,然后你赚的所有收益前提还是基于市场整体的行情,你至多可以规避下跌。但是其实有时候你会发现,标准的操作会代表长短仓,一部分做多,一部分做空。对散户来说这是相对复杂的事情,但是这表示给你带来一种可能性。


  第二种思路是动量+价值,这也是阿斯内斯这两年新写的一篇论文中提出的,你部分仓位做动量,部分仓位做价值投资。


  这两个因子一定程度上是风水轮流转的,他们不会偏执地认为我就做动量不做价值,或者只做价值不做动量。他不会拘泥于哪个流派是真理,他不在乎什么是真理,他在乎的是赚钱。


  所以把动量和价值组合一下,一定程度上可以规避这两者大小年的问题,这是非常好的思路。


  第三个是基于已经走出动量和价值之外的新的范式,这个范式是对未来的投资者来说可能要多多关心的,就是交易波动性。


  大多数我们在炒股票的时候关心的是上涨还是下跌。但是我们知道一个叫VIX的指数大家会知道,其实我们也有了,我们上证50有ETF期权,期权的波幅就可以算出A股的波动率。但是在中国只能通过A股交易期权本身,但是在美国期权的VIX已经是可以交易的品种了。


  在这样一个前提下我可以不关注A股是上涨还是下跌,我甚至可以投机的A股波动性在进一步扩散还是在逐步收窄,有时候这是比方向更容易判断的东西。而且这个东西的好处在于它的变动和股市方向变动是非常不一样的。


  这样一个策略其实可能是在这两年缺乏动量的波动性的前提下,是一个很好的补充,我觉得这个策略第一知道的人少,第二个是交易起来的思维方式和传统做多做空完全不一样,我觉得这也是值得关注的交易品种或者是交易策略。


  最后给大家分享做动量投资的时候大家可以留意的好的网站和信息来源。第一个是SSRN,他是一个学术论文库,大家做动量投资或者是量化投资的时候,大家要习惯的是除了看A股的分析师,做的年报之外,大家还是要习惯看英文的最新的学术论文。


  因为总体来说,西方的投资世界在对于一些投资理念上,或者是投资的实证上他们研究还是比我们领先的。虽然大家觉得他们可能在做象牙塔的研究。但是在量化投资学术界和产业界有千丝万缕的关系。甚至他们会合作发一些论文,像我前面讲到的阿斯内四很多论文会优先在这里发出来的。这要感谢互联网,在我念硕士的时候,我们要看一篇学术论文,必须用高校里花几百万买的学术论文引擎,这些引擎一旦你毕业后再也看不到了。


  但是现在大家崇尚分享,SSRN是很多大学教授把论文提交到期刊之前就愿意把文章上传到上面,这意味着你在这里可以看到免费的大量的几十万篇的论文,你可以用你关心的关键词去搜。


  甚至这里面有时候你真的会发现有宝。我曾经搜到一篇论文,不知道是哪个大学教授写的,就是关于如何在美股标普100指数中做动量投资,他自己给出了一个策略,而且那个策略长期回报还不错,一年超额收益大概20%。但是那个教授写论文指出这个模型在你交易成本1.5的情况下没什么好赚的,所以他不认为是件事。


  但这个模型对投资美股的散户来说先天就是非常好的模型,人家帮你测算完了,一分钱不要给你,就把模型公布给你了,只不过他觉得这个模型对机构没意义,对他做学术论文的意义也不算太大,你只要找到那篇论文就白捡那个模型。这样的东西在里面非常多。因为学术界和产业界很多研究会做的非常实在、非常细致。但是他对里面有些结果没有那么的重视。所以你经常愿意到SSRN里面找这些论文,你会发现有现成可用的论文。


  对散户如果有一点计算机基础,我建议大家学一下Python和Pandas,如果大家也留意金融工程的话,大家都知道Matlab,它是一个收费的数据分析终端,你可以买盗版的,但是我觉得没有必要,因为很多Matlab做的事情用Python和Pandas就可以做了。


  如果是一个对量化投资有兴趣的人,我觉得要学这门编程语言有非常大的意义。一方面可以获得很多数据,像以前我最早做28轮动的回测的时候,我是把数据拉出来,拉到Excel表里面,然后算。


  可能过半年有读者说能不能更新一下数据,我再把这个数据再算一遍,你会发现这是很无聊的事情,算的过程你要做很多中间的计算,还要绘图。这些工作在你第一次开发这个模型的时候会觉得很有意思,但是后面重演会很无聊。


  但是很多这种服务用Python就可以写一个程序,每次要做的就是到时间了把这个模型跑一遍,数据也出来了,图表也出来了,这是非常轻松的事情。


  我现在看A股也是这样,有一些我习惯的一些数据统计是现成的,A股软件没有的,我会做的是我把它写成一个小Python程序,让它跑一跑,一张按照我要求需要的一张报表,这样一张报表看起来远比我每天手工拉有意思多了。


  这里有一个叫Tushare的,是我们国内开发者开发的数据包,通过从很多免费数据库获得了A股的交易数据,虽然时间不长,但是做一些简单的交易的回测或者是最新的数据输出是足够的。


  这样你用Python、Pandas、Tushare,这三个加起来可以做一个非常简单的回测平台。我觉得对我们做量化投资的人来说,更幸福的在于国内现在好多的创业公司他们都从美国学了去开发了一些更简单易用的回测平台,包括优矿等等,这些平台可以用更简单的Python的语句,有点类似通达性的自定义公式做回测,甚至不需要写非常复杂的语句,就可以用专有语言完成一个统计。


  如果你想统计比如我每年买PE最低的10%的股票怎么样,对他来说可能十来行句子就写完了,这样可以让你做量化回测的时候更轻松。所以我解的其实对一个散户学一下Python的话,可能拉近你和专业投资者的差距,尤其在有类似优矿这样专用的回测平台之后。


  另外如果你是做美股ETF的人,这个网站你可以试一下,它是更傻瓜化的,ETFreplay。比如说它会把我刚刚说的三个月上涨就持有否则空仓这样的模型,做成了一个一个简单的已经打包的量,回测的库,有好多这样的库,你只要把你想回测的ETF扔进去就可以撤了。


  这个网站虽然非常好用,唯一缺点是收费的,一个月三十几美金。对于资金量比较大的美股投资者来说,这依然是物有所值的网站,因为它可以减少你非常多的开发的经历,而是把更多时间放在怎么调量化模型上,这个也是大家可以尝试看一下的网站。


  而且他还有部分简单模型可以供大家使用,我今天分享到这边,谢谢。


  (以上内容由启明星量化金融学院资讯部整理编辑,不代表本站观点。版权归原作者所有,如有侵权,请联系删除)