本文转载自“未止科技”。
故事的主角名叫Desmond Lun,今年37岁,已经身价千万美金。其实,刚开始读大学的时候,他是奔着“码农”的路线去的,根本没有想到自己会转行研究生物——在墨尔本大学学了4年数学和计算机,他又跑到鼎鼎大名的麻省理工学院(MIT)攻读计算机方向的Phd。
然而,在2003年却出现了生物学历史上的一次大事件:人类基因组计划(Human Genome Project)宣告完成,测定了所有人类DNA的序列,绘制出了人类生命的第一个蓝图。这时候,Lun作为一名数据专家,立刻就意识到人类基因组数据蕴含了无穷无尽的价值。于是,他决定要利用自己的计算机知识,去研究细胞和DNA。在Phd毕业后,他以博士后的身份来到了Broad Institute (牛人辈出的研究所,CRIPSR的发明者张锋就在这里工作),进行计算生物学(computational biology)的研究。
在这里,他开始构建数学模型,来探索基因之间的相互作用,以及预测这种作用对于表现型的影响。我们都知道,细胞的特征是由许多个基因决定的,它们之间有着复杂的相互作用,形成一个紧密的关系网络。举个例子,A,B,C三种基因,A基因产物(蛋白质)会抑制B基因的表达,而B基因产物会促进C基因的表达。如果A基因被抑制,那么最终的结果就是C基因产物增加,细胞特征会发生相应的改变 – 比如发生癌变。那么,到底哪些基因有着相互的联系?细胞癌变的产生究竟是由哪几个基因引起的?人类拥有20000-25000个基因,想要一个个去摸排它们之间的联系,工作量是不可想象的。因此,Lun开发的数学模型,就是用来预测多个基因改变所导致的细胞特征变化,这被称为因果相互作用(casual interaction)。Lun的模型将每个基因模拟成一个节点(node),根据现有数据为每个节点设置参数,借助机器学习和人工智能算法预测众多节点的关系- Lun已经开发了一套成熟的模型,并发表了18篇有分量的论文。
但是,学术上的成功却无法让这位学霸获得财富。直到在同事的启发下,他忽然意识到基因网路和证券市场惊人的相似之处:生物学家会利用基因层面的表达,来预测细胞层面的功能;而证券分析师正在利用股票交易的数据,来预测股票的股价 – 两者都在试图将杂乱无章的信息建立起因果关系。
也许自己心中的“华尔街之狼”已经苏醒,Lun立刻决定,要利用自己这套机器学习系统去预测金融市场的走向!
在2013年,Lun与朋友合伙成立了一家小型对冲基金——Taaffeite Capital Management,并亲自出任投资经理。他们采取量化交易的方式进行对冲投资。
Lun的机器学习系统,主要是用来探索到底是什么影响了各种指数(如标普500)的股票价格。这套系统收集了无数种证券、期货和指数的价格,如同基因一样构建成一个个节点。随后,人工智能算法会计算这些节点之间的因果关系(比如A股票价格下跌,B股票价格就会上升)。这样一来,他们就可以预测股票的价格和股市的走向了!
这听起来有点玄乎,但事实证明,Lun的算法发挥了奇效 – 2014年至今,他的基金保持了21%的平均年收益率。按照2000万美元的基金规模来推断,每年至少有几百万美元入账!
更令人惊讶的是,Lun的算法领跑了整个对冲基金行业:2015年,对冲基金行业的平均收益率只有不到1%,而Lun的基金是35%;2016年,行业平均是3%,而Lun的基金是23%;在2017年,行业平均是2%,而Lun的基金是10%!
在2016年英国脱欧之际,全球股票开始动荡。在6月30日这天,Lun根据算法的预测结果,投下了他最大的两笔赌注:做空MSCI新兴市场指数,做多FTSE 100指数。最后,Lun的基金大获全胜,他也因此一战成名。同年11月,Lun再次凭借特朗普大选的机会,成功套利。
利用人工智能和生物学去预测股市,毕竟是一项新兴事物,Lun承认未来的资金募集不会特别顺利。但他仍旧在新的计划中表示,要在未来6-12个月中,将基金规模扩大到2亿美元!
不过,作为一名生物学家,Lun并没有放弃自己的老本行 – 他目前在美国罗格斯大学担任教授,开展了一个更有雄心壮志的项目:利用机器学习模型预测各种微生物的细胞特征,从而指导人们对细胞进行基因改造。现在,他已经成功改造了大肠杆菌来生产生物燃料!
事实上,Lun的故事在今天已经不是个例了。华尔街已经越来越倾向于雇佣生物学家 , 尤其是那些掌握着先进技术的人才 – 他们可以借助生物学的原理和模型,来预测金融市场,让更多资本从中获利。 一位纽约大学的教授开玩笑说,现在华尔街都把自己手下的博士生抢走了,这让他十分苦恼。不过对于学生来说,是件好事——待遇优渥,前途无量。
看起来,生物学正在成为未来金融市场的有力武器,但仍旧有部分老牌的投资机构,如高盛集团,在怀疑这种从实验室“搬过来”的模型是否真的有效。因为,股票市场不仅仅是一种价格的相互作用,还有来自政策、经济等因素的博弈,这些不是人工智能可以理解的东西。