专访七桥基因:云端计算如何与基因学系统的完美结合?

2015-11-26 06:00 · 李亦奇

“七桥基因”公司是一家旨在测算人口规模生物信息的云动力平台,运用其重复性、规模化地测算交互性和自动化的分析,该司软件用于生物技术和制药公司以及国家政府,是在英美范围内唯一一家全国经营规模的生物信息公司,本文是对“七桥基因”董事长詹姆斯先生的专访。


10月份,记者在高创会期间在硅谷专访了“七桥基因”董事长詹姆斯先生。以下为访谈实录。

记者:谢谢詹姆斯,很高兴您能接受我们的采访,您可以介绍一下您自己以及您代表的公司吗?

詹姆斯:当然可以,也谢谢您采访我。我是“七桥基因”公司的董事长,我们是一家云端计算公司,致力于生物医学、数据分析;我们专注于国家型合约, 所以,我们两大客户国是美国政府和英国政府。我们正在为美国政府建设三个试点之一的云端,以便存储和分析世界上最大的癌症基因组数据集。实际上,我们的核心,是一家软件数据公司。

记者:您能不能介绍一下公司的核心技术呢?

詹姆斯:当然可以。我们搭建了一个平台,存放所有用于生物研究比如癌症研究、疾病研究、基因组学的不同工具。因此,它会为生物学家创建一些终端到终端的解决方案。而很多公司专注于做这其中的一件事情或者另一件,这使我们成为了政府型合约的理想选择。此外,我们还与大型制药公司,生物技术公司合作药物开发。实际上,我们非常热衷于寻找合作伙伴,并与我们在中国的合作伙伴合作,在那里运用我们的技术。 奥巴马总统为国家精密医学从联盟股份中拨出2.15亿美元,一个月之后,北京也宣布他们将在国家精密医学投入100亿美元。这是一个做大范围分析的巨大时机,实际上这也影响人着类健康,实在太让人兴奋了。

记者:人类社会致力于发展医学科技已有数千年了。刚刚听您提到利用云端计算呈现基因系统,您能不能讲一讲这种科技会为人类社会带来什么?

詹姆斯:当然。我们现在和亚马逊、谷歌合作,作为他们的云服务提供者,他们对基因组有很长远的投资,这伴随着对机器的认知,是个很吸引人的领域,也是大数据未来的趋势。微软公司也是我们潜在的合作伙伴,其实我们谈了很多微软Azure和微软的研究,他们向机器学习技术领域投入数十亿美元。

机会是实质,由于我们拥有所有这些数据,它们曾经需要耗费数百万美元对人类基因进行排序。而现在我们只需要花几千美元。所以,我们都能得到自己的基因序列,我们可以结合他人审视自己,以便进一步了解自己。

肺癌是一个很好的例子。我们之前认为肺癌只是一回事,只是一个单一的癌症,而我们也用同一种方法治疗患者;或者针对数十种癌症类型,治疗方式都十分相近。现在我们知道有许多不同类型的(癌细胞)突变,它只是恰巧在肺部被发现而已。所以,如果你远观未来,世界会是这个样子的:如果你得了肺癌,(医生)将观察数百万肺癌患者并找到哪十万人与你的情况最相似。以此,治疗方法变得更有效果,因为他们了解到化疗治疗并不会为你特定的癌症起作用,只有药物切割有效果。这将是未来的前景。(注:Microsoft Azure是由微软所发展的一套运算运算作业系统,用来提供云端线上服务所需要的作业系统与基础储存与管理平台,是微软的云端核心组成元件之一,以及微软线上服务策略的一部份。)

记者:您认为当这种技术运用之后,人类将不再需要化疗治疗,而是进行基因修改治疗?

詹姆斯:我需要说明,我并不是一位肿瘤科医生。这个机会让人们更好的识别谁应该进行化疗,谁应该进行药物治疗;那些不需要进行化疗或者化疗对其不起作用的人就没有必要再去化疗。这是研究基因学的人们的美好愿景,尽管癌症是致命的疾病,希望人们患了癌症之后还能继续生活。很多研究基因学的人都相信这是可行的。

记者:我可不可以这样理解,运用大数据分析人类身体、细胞和基因可以提升化疗治疗的成效?

詹姆斯:是的。我认为癌症治疗的成效会提升,除此之外,还有化疗的构成。在西雅图的系统生物研究所里有很多令人振奋的研究正在进行着。研究所正在做着的是着眼于整个系统、整个人体并对其收集数据。很多大型客机公司,包括微软,正试图采取类似的做法,因为当病症来源于身体其他部位时,很难根据一件事情而制定治疗方法。所以,当了解了(身体)整个系统之后就会有更多的契机。

记者:让我问您一些辩证的,或者说是很现实的问题。我自己有四颗智齿,我十分讨厌它们。您有什么办法能解决这类问题吗?

詹姆斯:我知道的最好的解决方法是我可以给你介绍一个牙医。不过,从一个纯基因科学的角度来说,没有解决办法。针对特殊的情况倒是有个方法,就是使用体外受精的方式来控制特定的事情。比如说,有一个公司 。。。

记者:从生育的角度?

詹姆斯:是的,从生育的角度。十分抱歉您现在要面对智齿的问题。

记者:那我还能回到出生的时候吗?

詹姆斯:十分抱歉,我不能解决这个问题。但是在出生的时候,我们有办法通过体外受精选取特定的精子变体,有的可能与突变触发,有的并没有。通过选取合适的精子来控制降低婴儿心肌病的风险,或者降低胶囊纤维化的风险。当我们了解了越来越多染色体的不同组成,我们就能做出更明智的抉择,通过试管受精治愈疾病。这对新父母以及那些为下一代着想的的人来说是非常兴奋的。

记者:我们能够百分之百的通过精子或者其他(类似方法)而运用基因从而避免孩子们患上流行疾病吗?或者防止他们感冒?

詹姆斯:这确实是个好问题。我们持有的数据在飞速增长。第一组人类染色体图直到2001年或是2003年(取决于您参考的数据)才被标示出来,而现在我们有成百上千的地理信息系统(GIS)致力于百万基因组计划。英国正在做十万个,当我们拿到这些数据,我们确实找到更多用来研究的(染色体组)变体,但这依旧不够完美。我们始终还不能控制所有的情况,它仍然是一个概率游戏,亦或降低可能性,抑或增大可能性。

记者:您的研究中最艰难的是什么呢?您的瓶颈在哪里?

詹姆斯:这是个好问题。我们的瓶颈在哪里?

记者:您们有遇到瓶颈吗?

詹姆斯:我们当然有瓶颈。项目进展得很顺利,不过我认为获取数据可能是我们最大的瓶颈。因为生产出来了比以前多了很多的(基因)序列,这个问题正在被解决。这个问题的产生是由于很多机构不想共享他们的数据,他们想独家持有。我们公司正在试图从全球范围内,通过潜在的、分析的方法搞清楚如何能够让研究机构、药物公司共享那些数据。这样一来,我们不仅仅观察到一万份肺癌样本,而是可以观察到一百万份,研究也会进展得更快。我觉得这是我们作为一个产业当下面临的最大的问题。

记者:我听说了硅谷的基因改造工程,注射到高科技工程师的细胞或者大脑中,能使他们十分清醒高效的工作,以生产更高效的产品。您对这种工程怎么看?

詹姆斯:据我了解,这听起来像是夸张的营销。这也很好的例证了一句话,有些事情听起来太好了以至于不像是真的,那他可能就不是真的。所以我会对任何人承诺能够做到这种事情表示怀疑态度,就目前的CRISPR/Cas及基因改造技术而言,我觉得这种产品的存在性很小,很可能是有人在做营销,做一些没有科学背景支撑的宣传。(CRISPR/Cas系统,为目前发现存在于大多数细胞与所有的细菌中的一种后天免疫系统,以消灭外来体质或噬菌体并在自身基因组中留下外来基因片段作为“记忆”。)

记者:您运用科学数据断定这是谣言,或者说是有人在做营销,纯粹营销或者出于经济原因(的营销),是吗?

詹姆斯:对的。我对此(产品)深表怀疑。

记者:您认为基因数据探索除了有利于医疗领域以外,对其他领域的影响呢?比如军用,或者是改变我的基因系统,从而使我能够听到更多、看到更远?

詹姆斯:是的,尤其是在病毒学的研究上,有项目正在研究如何使军人们在战场上更好地面对病毒暴露(的危险)。(这项技术)在法医学上也是有很大的市场,有一篇纽约时报的报道说,如果我们能够获得DNA, 他们可以根据你的DNA对你进行面貌重建。所以,(这项技术)对医学界是非常重要的,我们能更好地了解种族和物理属性;其他方面,比如说农业,通过基因改造生产出更好的产物。孟山都公司(Monsanto)就是个很好的例子。

记者:转基因食品安全吗? 我们听到很多就转基因食品问题的讨论,很多人说不要吃转基因食品,因为它很危险,将会抑制人类繁殖、降低智商、缩短人类寿命。有很多传言宣传不要吃转基因食品。您对转基因食品有什么看法?

詹姆斯:我自己并不是个好例子,我会吃任何东西,比如快餐、速冻食品。我不会针对转基因食物采取官方的说明。我觉得要取决于是被什么(因素)而修改(基因)。我认为有的转基因食物是没有问题的,有的却不行。所以,还是取决于其被什么而修改(基因)。

记者:通常,我们会用白鼠做一些实验。您的实验室会做一些怎样的实验呢?

詹姆斯:我们和很多诊所实验室合作,我们也有很多白鼠来实验不同的产品。我们做的是软件开发,确保诊断公司可以进行医疗就诊,当他们有一个为特定测试准备的血样,或许是诊断癌症,我们会做的是帮助他们运行分析软件,从而他们知道这个样本是做什么的,以及它的特性。因此,他们可以了解那些病毒并用来日后研究。

记者:您的大部分研究都是与软件、云计算相关?

詹姆斯:所有都是与软件相关的。我们现在有135人,但是是通过云平台实现,但公司经营的全部是软件生意。

记者:你们采取人类细胞分析数据吗?

詹姆斯:不,不过和我们合作的大多数公司都在做人种(相关的研究)。

记者:您有很多的基因大数据。您能给我们一个数字吗?百万、千万、数十亿?

詹姆斯:我们还没有到达那个数字,不过在接下来的几年,我们将会有百万份患者的基因组序列。 哦,是的,从基因序列提供者得到的数据数量将会像这样(发展下去)。现今,地球上的基因数据少于百亿亿的四分之一,但是到2018年时,我们预测将会超过2.4百亿亿。这相当于12万小时DVD质量的视频,是一个相当疯狂的数据量。但我们现在拥有成千上万的例子,我们最大的PB级样本来自于癌症基因族谱,该族谱是最大的单一与集合的联盟(族谱集), 是最大的演绎癌症基因数据集。

记者:您有没有想过这些会数据落入了恐怖主义的手中?您和您的机构如何保护这些数据以免被恐怖主义所利用?

詹姆斯:是的,这是我们创造敏感数据库的风险的很好的例子。所以,对我们来说,保持高度安全性是很重要的。这也就是为什么我们与亚马逊网络服务合作,他们提供非常安全的设备,我们有很多形式的加密,我们都赞成美国公民信息是非常重要的。在中国,我们与百度和阿里巴巴这样的合作伙伴合作。实际上,我们并不接触中国的数据,那些数据将会在中国保存。我们的软件将会应用于中国,但是那些数据绝不会离开那里。我觉得每一个国家都视基因数据为国家安全数据集,大多数国家不希望数据离开本国。所以,你必须要找出方法,让那些国家的人为数据而工作,并且保护它们。我们希望世界上的所有人都能加速进行癌症研究,希望我们的软件工具应用于任何地方。我们绝对不会在保存数据上出现问题,我们会确保它安全。

记者:哪个国家的数据最多呢?

詹姆斯:现在来说,最多的数据是在美国。

记者:美国人口数据吗?

詹姆斯:对的,是美国人口数据。我们也将要和英国合作研究数十万基因组,英国是国际(数据数量)上的领先者。我相信中国马上也会赶上来,因为那里有巨大的动员能力,并且这似乎也是国家优先事项。所以我认为中国有机会成为第一个研究百万数量基因组的国家,但是现在,美国与英国处于领先地位。

记者:为什么您以“七桥”来命名您的公司呢?我听说“七桥”来源于英国,对中国来说,犹如十七、十八世纪的传教。为什么以“七桥”而命名呢?

詹姆斯:公开说明,我们可没有传教!这个名字来自一个叫做“柯尼斯堡七桥”的数学问题,这个问题现在已经被解决。普列戈利亚河穿越柯尼斯堡,由七座桥连通,凌驾于普列戈利亚河之上。人们声称可以在不重复过桥的前提下走过七座桥(而穿越城市)。然而,数学家莱昂哈德 欧拉证明,这是不可能的。我们做的很多基因组学的工作是基于这个数学问题,这就是所谓的图论,我们根据这个核心数学问题开发软件,也因其命名我们的公司。

记者:讲到科技,我们有微软,比尔·盖茨改变了人类使用私人电脑的习惯;史蒂文·乔布斯改变了人类使用手机的习惯;现在云端计算也改变了人类社会。您有没有最新的科技产品,可以给我们一些想象空间,比如X战警,我们可以长出翅膀、长出第六根手指,或者第三只胳膊?您觉得呢?

詹姆斯:我要十分小心我作出的承诺!我认为基因学展现了尽可能多的机会通过云计算和个人计算来改变我们的生活。每一个拥有智能手机的人将会在接下来的10年、20年拥有全部的基因组序列,他们在一生中还会拥有不止一次。随着液体活检的发展,我们将会有能力预测你患癌症的几率。当谈到复发,我们会给你一个更好的预警系统。因此,你不用坐以待毙。所以,(这项技术)真正的目标是让人们更健康、更长寿,我觉得我们会在不远的未来实现这一愿景。

记者:您怎么看待将大数据分析应用于克隆技术呢,动物或者人类科隆?我们可以得到第二个詹姆斯。

詹姆斯:对的! 我认为,这存在很多道德上的问题需要被解答。政府并不愿意让科学家去实验,但我们有克隆羊,我觉得这个技术很快就能够应用。

记者:您是克隆技术的支持者吗?

詹姆斯:我认为很多科学家看到了科隆动物的价值,这是实验的一种形式。但是总的来说,科隆存在着很多道德上的问题,我觉得有很多比我聪明的人可以回答这个问题。

记者:您的产品能否帮助提高乳腺癌或者其他癌症的治疗效果吗?

詹姆斯:由于医学,治疗乳腺癌的方法已经十分惊人了。在患有乳腺癌、转移成为乳腺癌的女性的基因中发现了大量BRCA1和BRCA2基因。而随着乳腺癌相关基因组数据的发展,我们对乳腺癌以及潜在疗法的理解也会提升。所以,我确实认为你将会看到更佳的早期预防方案。随着我们的数据的持续提升,癌症患者的治疗方法也会提升。

记者:我听说,尤其是在亚洲国家中,化疗之后的乳腺癌症治愈率非常低,但是美国却很高。您认为这是不是(美国)基因工程和研究在医学领域运用的结果呢?

詹姆斯:我不太确定。很可能有很多因素在影响(这一现象),这其中包括更好的药物治疗。如果能搞清楚这是否跟新一代(基因组)序列测试有关系,那会十分有趣,但我并不确定。人类基因组数量的上升是一个全球性的挑战。全世界七个国家的研究者,耗费数十亿美元,致力于研究勾绘第一张基因图谱。我认为下一个伟大的比赛是从大数据方面理解基因学。如果我们能做到这点,将会帮助我们提升人类健康水平并延长寿命,在很多例子中,实际上则治愈了疾病。我们作为软件分析的这方面,只是其中的一小部分;还有很多大公司在其中扮演着重要角色。我认为在未来十年之中,我们会在人类健康上发挥重大作用。

记者:您是什么时候开始研究这类软件的呢?

詹姆斯:我的背景实际上是广告技术。公司创始人丹尼斯·克罗尔2006年和马克·扎克伯格在和佛学院的同一个的数学课 ,他实际上拒绝了成为前十至十五人去脸书(Facebook)工作的机会。我公司的创始人与他在数学课上有接触。因此,他留下来学习数学,并获得生物信息学博士学位,开始了这家公司,而后我加入了他,那时我们在哈佛住隔壁。大约一年后,公司成立,于是我们开始在2011年认真钻研,但是公司其实成立于2009年。我们有很多年轻人在公司工作,在整个135人中,平均年龄是34,是个十分年轻化的公司。

记者:您得到风险投资了吗?

詹姆斯:我们已经采取了创造性的战略,我们也有一些不会公开的机构性投资者。我其实是早期的投资人之一,我用我以前广告资产的资金来投资。我们现在有一些其他的合作伙伴,我们也将融资,我们还可以运行很多年。我正在将员工人数增加一倍,希望截至明年年中达到300左右。