基因的神秘和魔力在哪?基因和互联网结合,未来的生物产业将发生什么样的变革?创业16年,华大在基因的这条道路上摸索的核心竞争力是什么?7月初,华大基因CEO王俊在深圳华大基因总部接受了网易科技独家专访,解读基因的未来。以下是本次采访的详细内容。
华大不是“基因界富士康”
提起华大基因,多数人的第一反应是“基因测序”。华大基因最初闯入公众视野,是2010年从美国基因测序仪器公司illumina购入128台高通量测序仪,这使得华大一举成为全球最大的基因测序机构,并从那之后被称为“测序工厂”、基因界的“富士康”。
王俊认为,给华大基因“测序工厂”的定位并不准确。
华大基因的历史是从“人类基因组计划”开始的。人类基因组计划于1990年启动,6个国家投入总计30亿美元,绘制出了人类基因图谱,试图破译人类遗传信息。它与“曼哈顿原子弹计划”和“阿波罗登月计划”并称为三大科学计划。
华大基因成立于1999年,承担了这个计划大约1%的工作。之后,华大基因又参与了水稻基因组、国际人类基因组单体型图计划、第一个亚洲人基因组图谱、大熊猫基因组计划等大型基因组项目。
王俊认为,华大的核心竞争力在于是全球唯一打通了基因产业的上中下游全产业链的一家机构。在国外,基因产业的整个流程更多是由上中下游各个环节合作完成。
王俊告诉网易科技,基因是一个完整的产业链。基因测序只是第一步,它能告诉我们人类基因携带了哪些信息。但是光知道这些信息是不够的,还要知道这些信息意味着什么。所以,还要弄懂这些信息,以了解基因信息和人类表征之间的关系。再往下一步就是应用,具体到人本身,就可以用作临床诊断。比如由人携带的基因就可以预测这个人以后得某些病的风险。
他解释华大基因之所以要打通全产业链,是随着华大的发展历程,一步步地搭建起来的。“我们最早做人类基因组测序,之后发现测序技术还得自己掌握,如果不能掌握的话,很多大型的科学计划是没有办法实施的,因为你的试剂和仪器、设备的这些东西不可控。最后就想,我们要在上游把它发展起来,然后可控。再走一走你发现你弄出来的这些科学产品如果不推向临床,又没有什么太大的意义,我们自己当时又找不着人能够做这样的事情,那我们就自己又往下游走又走到下面去了。”
同时,打通全产业链可以使基因测序服务的成本大幅降低,这将大大推动基因测序服务的广泛应用和普及。在完成对CG的收购之后,王俊曾表示,这有助于华大基因降低对Ilumina等上游公司的依赖,测序服务成本也有望大幅降低。“并购之后,能够做一些让大家都非常兴奋的大型研究计划。CG有上游,华大基因有中下游,两家合起来以后,可以更快地推动这些计划。”
对华大基因的未来,王俊认为,不仅仅是打通基因全产业链,从规模、市场和整个体量,华大基因也都可以做到全世界最大。但是,未来华大会有多大的体量,王俊表示还无法估量,他说:“因为华大其实是个全球性的机构,每一个有需求的人,都应该可以被基因检测,然后很多他所需要的重要信息,逐步地能够被科学所解释,能够逐步地享受到相关产品和服务。所以某种意义上来说,现在很难去规划未来的五年和十年的发展状况会怎么样。”
BT和IT从根上是一起的
那么,一般被认为属于生物科学的基因产业将如何与互联网发生联系?二者结合又将发生什么?
王俊告诉网易科技,从华大基因诞生的第一天开始就是和IT技术结合的。
他解释,生命科学最早是观察性的科学,就是观察动植物的样子,发现其中的联系,很长一段时间这是生命科学最主流的东西。之后就逐渐变成了实验科学,开始用实验的方法来尝试解释观察到的现象,这些实验越做就越到分子层面。现在的生命科学变成了一种大数据科学,比如要研究糖尿病跟基因之间的关系,需要采集大量糖尿病人的基因数据,同时采集大量健康人的基因数据,然后来做统计模型,发现到底哪些基因跟疾病有关。
“所以,你看,BT和IT的结合并不是从今天才开始的,而是现在他们从根儿上就是一起的。”王俊说。
1999年,华大基因成立并且承担了人类基因组1%的工作。王俊解释,基因解读是个非常复杂的计算和数学问题。基因数据量很大,这些数据需要经过分析、处理,才能搞明白基因和疾病的关系,而这需要大量计算和存储。此外,计算方法和整个科学研究理论都需要有新的突破。“所以从一开始它就有别于在实验室里面拿离心管、枪头来做科学实验,它更多的是一种计算机数学和生物学的交叉学科。”
王俊认为,互联网更是这样,因为你所有数据和样本的搜集、所有数据的发放、科学家的参与,实际上是全球化的。这种全球化的东西,需要借助互联网的力量。
王俊介绍,华大基因在国外多云存储和云计算的行为是在亚马逊的云上面部署的。在国内,华大基因有一个大型的计算中心,并且在香港有一个计算中心的布局,华大基因本身有一个核心的计算网络,同时还与一些机构合作。“在国内,我们跟阿里、腾讯、华为都在进行沟通,都在设立一些计划,看看有没有可能再往前再走一步,像百度等,我们其实都有一些正在探讨的,或者有一些是已经在合作的一些计划。”他透露。
当基因组网络化人类会怎样
2014年8月26日,华大基因旗下互联网云平台Genebook基因谱在北京国际会议中心的“中国互联网大会”现场搭起展台。华大基因官网发布消息称,“这标志着全球最大的基因研究中心华大基因开始迈向互联网时代,华大基因将基因科技和互联网有机结合,让基因科技更好地造福人类。”
华大基因的工作人员介绍,比如华大基因应用最广泛的无创产前基因检测,原来都是通过医院的渠道,通过医生向孕妇推荐。现在,华大基因希望通过互联网平台,直接到达消费者。这样可以使得基因检测的普及面更广。“我们希望借助这个平台触达每个人。”王俊说。
王俊指出,如果把每个人的数据都连起来,形成基因组网络,其中的机会不可估量。
他向网易科技解释:“互联网是把一台一台的计算机连起来,互联网的历史是从超级计算机开始的,然后有个人电脑,然后个人电脑开始连起来,变成互联网。计算机是这样,基因组序列也是一样的。”
“什么意思呢?”他接着说,“最开始的时候我们测定了一个人类基因组,就像一个超级计算机一样,现在可以每个人都承担得起自己的基因测序。但事实上再往下做呢?是把这些每个人测定的基因点连起来,这叫基因组的互联网,就是基因组的网络。”
王俊解释,这些基因之所以能够连得起来,就是因为我们地球上的任何两个人往前追溯,到一个时间点上都有一个共同的祖先。全世界的所有的男人,到十万年前左右都可以追溯到一条Y染色体,全世界所有的女人到十几万年前可以追溯到一条线粒体序列,基因之间是有联系的,有很多相似性。
“比如一些疾病的发病率非常低,但事实上在全球范围内,你也是能够找到它相对应的案例的。所以这种网络效应连接起来的时候,是更厉害的。很多时候基因的互联网,可能对于生命健康所产生的效应会更加大。”他举例说。
王俊曾指出:“如果把每个人数据都连起来,形成基因组网络,我们就可能有机会把这个基因和病之间的关系搞清楚,在上面会形成各种各样的机会,这些机会、信息和知识是以前我们在做一个个人基因组时不可想象的。”
华大基因正在打造基因网络的道路上奔跑。“我们目前最重要的工作是推出一些医学和科技服务的产品,能够用到广大老百姓那去,让老百姓能够真正享受到基因科技给他带来的一些益处。”王俊说。