《科学》重磅:5万人基因组+电子病历数据揭示基因与疾病重大关联,科学算命不远矣

2016-12-27 06:00 · brenda

北京时间上周五,顶级期刊《科学》刊登了重要的科学进展。后起之秀Regeneron Pharmaceuticals和Geisinger Health System祭出了两篇重要研究成果,它们综合分析了5万多人的基因组数据和临床电子病历(EHR)信息,发现了420多万个罕见基因变异,确定了大量潜在新的药物位点,并明确了基因测序在患者健康管理中的重要作用。

本文转载自奇点网

2012年,基因产业界暗流涌动,制药巨头安进(Amgen)斥资4.15亿美元全资收购deCODE genetics,这个拥有「世界上最有价值基因组数据库之一」的公司,坐落在冰岛,拥有近40万人的基因组数据。

同样在那一年,业界很多人开始意识到,产业界的发展趋势要变了,以后合作的大门有可能逐一关闭。一大批药企和医院纷纷启动自己的基因组测序计划,希望拥有自己的数据宝藏,深度挖掘基因与疾病之间的关系。

今年5月份,deCODE没有辜负安进的希望,它在四大顶级医学期刊之一的《新英格兰医学杂志》发表文章,宣称他们找到了保护心脏的罕见基因突变(1),携带ASGR1功能缺失性突变的人,患冠心病的风险降低35%。不到四年的时间,deCODE给安进贡献了一个意义非凡的药物靶点,这意味着人类基因组数据淘金时代已经开启。

收购了deCODE的安进虽然占得先机,但是并没有完全垄断市场。北京时间上周五,顶级期刊《科学》刊登了重要的科学进展。后起之秀Regeneron Pharmaceuticals和Geisinger Health System祭出了两篇重要研究成果,它们综合分析了5万多人的基因组数据和临床电子病历(EHR)信息,发现了420多万个罕见基因变异,确定了大量潜在新的药物位点,并明确了基因测序在患者健康管理中的重要作用。

制药公司Regeneron成立于1988年,在2012年意识到行业的变化之后,开始考虑在基因组领域布局。2014年1月,Regeneron组建基因组中心Regeneron Genetics Center,并宣布与Geisinger合作,开展10万人基因组研究,挖掘基因与疾病之间的关系,以促进Regeneron的药物研发,和Geisinger患者的健康管理。它们把这个合作项目称作DiscovEHR。

Geisinger是美国最大的健康服务机构之一,它早在1996年就开始采用电子病历(EHR)管理系统,它目前服务于宾夕法尼亚州45个县的300多万居名,拥有非常完整的患者健康信息。截止目前,Geisinger的用户中有超过12.5万人自愿贡献出了他们的电子病历。

本次的研究涉及到其中的50726人,其中98%的人有欧洲血统,他们的年龄分布为48岁到73岁,中位年龄为61岁;他们的电子病历建立时长在11年到17年之间;接受随访的中位数是87次;患者病历中的检测结果最少有197个,最多的高达1119个,中位数为658个;还有各种疾病的诊断信息等等。

在Regeneron和Geisinger的第一个研究中(2),他们给这5万多名患者做了外显子测序,涉及到18852个基因。他们一共发现了超过420万个基因突变(点突变、插入和缺失)。每个人身上都携带大量的基因突变,其中点突变的个数中值超过2.1万,缺失插入突变超过1000个,在这些所有的突变里面有800多个是之前没有发现的。同时,他们还在这些患者身上发现了超过17.6万个基因出现功能缺失突变,每位患者携带基因功能缺失突变的中位数为21。

然而,这些突变究竟意味着什么?这才是科学家最想知道的东西。这个时候Geisinger的那些高质量的患者电子病历的作用就显现了。据研究人员介绍,这是首次大规模地将外显子数据与电子病历信息结合起来分析基因变异与疾病之间的关系。

Geisinger将患者的电子病历脱敏之后,交给Regeneron,Regeneron将这些基因变异数据与电子病历结合起来分析,试图找出这些变异背后的意义。

于是他们首先分析了空腹血脂(胆固醇、低密度胆固醇、高密度胆固醇和甘油三酯这些心脏病和中风相关的物质)水平和那些罕见突变之间的关系。他们发现APOC3、APOB、CD36、G6PC和LDLR基因的变异,与血脂水平之间存在一定的关系。有了这些位点的信息,研究人员可以根据它们跟血脂之间的关系,设计潜在的治疗药物。

最后,研究人员在这个庞大的群体中随机选了1415人,分析了目前公认与疾病相关的76个基因内的突变在患者中的携带率,他们惊讶地发现,在这个群体里,竟有3.5%(49)的人携带BRCA1等与疾病关系明确的点,这个比例要高于之前在小群体研究中得出的2%。

既然研究人员说这49人携的突变都是致病突变,那么他们这种预计准吗?当研究人员再把这些患者的病例调出来一看,他们发现其中有32人(65%)表现出了相关疾病的临床特征,但是只有7人(14%)被明确诊断。研究人员认为,这表明,基因组学有潜力用来引导临床健康管理。

在接受《科学》采访时,Geisinger临床基因组学主任Michael Murray说,「这些突变有可能会威胁到他们的生命。」不过好在Geisinger将检测结果反馈给了它的用户,以便他们根据这个结果做相应的健康管理。与参与研究的自愿者分享研究成果,这也是基因测序研究领域不常见的现象。

▲Michael Murray

既然他们已经证明了他们这种研究方法是靠谱的,它可以让我们明白基因变异在健康和疾病中的作用。那么是不是要在一个特定的疾病中试试呢,毕竟这5万多个患者涵盖的疾病太多。

于是Murray就带队挑了与冠心病和中风有关的家族性高胆固醇血症(familial hypercholesterolemia,FH),FH是一种筛查方法玲琅满目,但是很难被诊断的遗传病。前期的研究表明,FH主要与LDLR、APOB和PCSK9三个基因的变异有关。

根据目前的研究,在上面三个基因中,有19个基因变异位点在临床上被认为与FH有关,还有16个潜在的基因变异位点与FH有关。于是Murray团队在这5万人中寻找这35种基因变异,找到229人至少携带一个基因变异。这就意味着跟FH相关的基因变异,在这个5万人的群体中携带率为1/256,这个比例远远高于之前认为的1/500。

那这些携带变异的人是不是就比不携带的人危险呢?研究人员调出相应的电子档案,分析发现,携带这些基因变异的人,他们体内的「坏」胆固醇显著高于不携带FH相关基因变异的人;而且携带FH相关基因变异的人,患冠心病的概率显著增加。看来携带FH相关基因变异的患者确实患病风险更高。(具体数据可以参考文献(3))

然而,在基因检测之前,仅有15%的FH相关基因变异携带者被诊断为FH,仅有24%的患者的电子病历数据显示携带者有发病迹象。总共有58%的携带者在服用他汀类药物,但是一半以上的人并没有收到良好的疗效,这意味着,这些患者的治疗力度还不够。

范德堡大学心血管疾病遗传学家Daniel Roden在接受《科学》采访时表示,以上的研究表明,在整个人群中筛选胆固醇升高相关基因变异可能是有意义的。

当然,上面的两个研究只是DiscovEHR的最新研究成果。早在今年3月份,Regeneron和Geisinger利用同样的方法,找到了一个新的冠心病治疗靶向位点ANGPTL4,携带ANGPTL4基因功能缺失突变的人,患冠心病的风险下降45%左右,他们的这一重大发现也刊登在《新英格兰医学杂志》上(4)。

无论如何,这个大型的临床研究表明,基于基因组测序的精准医学计划是靠谱的,将基因测序和临床数据结合起来潜力是无限的。这对于我们认识疾病的发生和发展大有裨益。然而,如何将基因检测数据与临床数据结合起来还是个大问题,毕竟像这种类型的研究还很稀少。

参考资料:

【1】Nioi P, Sigurdsson A, Thorleifsson G, Helgason H, Agustsdottir AB, et al. 2016. Variant ASGR1 Associated with a Reduced Risk of Coronary Artery Disease. New England Journal of Medicine 0:null

【2】Dewey FE, Murray MF, Overton JD, Habegger L, Leader JB, et al. 2016. Distribution and clinical impact of functional variants in 50,726 whole-exome sequences from the DiscovEHR study. Science 354

【3】Abul-Husn NS, Manickam K, Jones LK, Wright EA, Hartzel DN, et al. 2016. Genetic identification of familial hypercholesterolemia within a single U.S. health care system. Science 354

【4】Dewey FE, Gusarova V, O'Dushlaine C, Gottesman O, Trejos J, et al. 2016. Inactivating Variants in ANGPTL4 and Risk of Coronary Artery Disease. New England Journal of Medicine 374:1123-33

关键词: 精准医疗 基因