7月17日,华大基因CEO王俊“离职”的消息在科技圈传得沸沸扬扬。
华大基因是全球最大的基因组研发机构,也是中国生物产业的领头羊,目前全球大约一半的基因数据是由华大基因生产。王俊从23岁在北京大学读硕士的时候就加入华大基因,并在之后成为华大基因重多代表性科研项目的核心参与者,在华大基因并不平顺的创业历程中一直荣辱与共。如果王俊果真离职,就意味着一定有大事发生。
当天,华大基因官方发布公告,原华大基因CEO王俊主导组建以人工智能为核心、关注前瞻性业务发展的新业务机构。王俊继续留任华大基因董事会,出任董事合伙人。并称“本次调整,旨在推动华大基因对前瞻性业务的战略布局,为引领中国乃至全球生物产业发展再创辉煌”。
8月6日,王俊接受网易科技专访,详解了其中原委。
“所有的要素都具备”
华大基因的公告中,王俊即将牵头组建的“以人工智能为核心、关注前瞻性业务发展的新业务机构”,听起来似乎有些遥远。
然而王俊的判断是,“所有的要素都具备”。他认为,目前促使基因与人工智能结合的科技和商业的要素都已经具备。他说:“就像你做一个木桶,没有一块板是完全短到要漏水的,你看不到这个,你觉得基本上这个木桶能做起来。”
从科技方面来讲,王俊认为核心的原因之一是,人工智能的发展取得了巨大的进步,其瓶颈的突破已经是可以看得见的。他分析,人工智能包含三个要素:算法、计算能力(即能够处理的计算量)、数据量。王俊本科阶段即辅修计算机和人工智能,他看到在过去20年中,人工智能的算法和计算能力就有了巨大的进步,同时基因检测的成本已经可控并且会越来越低,“一旦到了这个时候,所有大数据的各个方面,包括可穿戴数据的发展,包括现在电子化病历和很多医学数据的信息化,所有的这些东西都让这件事情已经到了一个可以聚焦和合并,和会聚的一个时间点。”他说,“在这个时间点上,事实上这件事情是真的可以去做。”
人工智能的转折点正在来临的判断,在科技界正在逐步形成共识。
美国科学家、人工智能专家库兹韦尔在《奇点临近》一书中预测,2045年,奇点来临,人工智能完全超越人类智能(科学家们将机器变得超级聪明的时刻叫做“技术奇点”)。
而在今年2月百度举办的“The Big Talk”上,百度首席科学家吴恩达、康奈尔大学机械制造实验室主任Hod Lipson(霍德.利普森)也都基于各自的工作认为,人工智能的转折点正在来临。
当时,美国奇点大学生物技术和信息学项目负责人Raymond McCauley(雷蒙德?麦考利)介绍,现在摩尔定律已经和生命技术联系在一起了。斯坦福大学独立访问学者Walter Greenleaf(沃尔特?格林利夫)指出,所有基因意义对健康的影响,现在已经变成了计算机计算能力问题。
王俊所指的“要素”中也包括商业模式,他认为现在大家对互联网企业先投入、再谋求长期商业回报的模式已经普遍接受,只要正确的事情最后一定可以得到应有的回报。这使得基因和人工智能结合这件事,可以在早期不必过于计较短期的商业回报,而着眼于更长远的发展,从而形成“科学与商业双赢的局”。
甚至,他认为对他自己来说,这个风险是“可控”的,他说:“我自己这20年的积累,我要是觉得它真的是一个特别做不成的事儿,我可能也觉得时机不到。但是对我来说是个很自然的转换,就是走到这儿了,就像华大过去很多历史阶段的每一个里程碑,都是看上去好像都是很大的变化。但是其实走过来,回头看看都是一些很自然的决策和转换。”
筹划“二次创业”
王俊把这个视为自己的“二次创业”。
第一次创业,始于加入华大基因的1999年。当时华大基因的几位合伙人自掏腰包,参与了人类基因组计划,承担了其中大约1%的测序工作。拿到了全球基因核心圈子的“入场券”,并发展为全球最大的基因测序机构。
尽管现在越来越多的基因信息被检测出来,成本也越来越低。但是王俊告诉网易科技,对基因信息的真正理解,目前还非常初步,还远远没有能够真正的把基因的生命奥秘完全解读的地步,也远远没有能够真正地在这个原点的基础上促进未来生物产业蓬勃发展。要想做到对基因信息的真正理解,需要一个大型的生物链数据化的一个数据库,同时需要人工智能系统来处理这些数据,从中找到规律。
对于这项工作未来可能取得的成果,王俊用了迪士尼动画片《超能陆战队》中的健康机器人“大白”来形容。片中“大白”能够快速扫描,检测出人体的不正常情绪或受伤,并对其治疗。而华大基因的“大白”,可以解读人类基因和健康信息,从而对健康风险进行预警、进行精准医疗和个性化医疗。
王俊告诉网易科技,他接下来要做的就是,“很快搜集健康类的大数据,就是各种各样的生命体征和信息的大数据,然后在这个数据基础上,去建立一个人工智能的内核模型,然后把它对接起来,做这样一个整合。”
目前,新的机构还在筹划当中。王俊透露,希望能够和擅长大数据处理、人工智能的互联网公司合作,用3年时间至少筹资100亿来完成这个计划,并且希望这个计划的实施是全球化的,不仅仅局限在中国,希望在年底能够有一个比较清晰的构架,能够开始启动这项工作。
同时,他已然拿出了在这件事情上长期投入的决心:“当然它不会一蹴而就,可能需要五年的时间、十年的时间才会做出一个真正的雏形,能够往前走的一个雏形。但是我觉得很值得,我自己本人也很愿意,用我未来十年二十年的时间来主要聚焦在这件事情上。”
他解释:“做这个事情的出发点,其实背后就在于,我认为生物产业的整个生命产业的发展,和生命科学的发展,数据的不可或缺性,以及这么大规模的数据的不可或缺性,是一个非常重要的内核和引擎。只有把这样一个东西做好,才有可能在这个数据的基础上,形成各种各样的前瞻性的应用,所以它是一个内核和引擎,这是非常重要的。就跟计算机工业的CPU一样的东西。几乎所有的生物产业的发展,最终都会需要这个引擎。”
他坦言,现在全球顶级的生物产业公司并没有都在做这个工作,很多还在思考和观望,但是华大基因必须做,“再晚点不怎么样,就像中国很多的行业一样,晚一点没关系呀,但是你愿意晚吗?”