8月18日,哈佛-麻省理工Broad研究所的科学家在Nature公布了60706名不同种族个体的外显子序列。作为外显子组聚集联盟(Exome Aggregation Consortium ,ExAC)的成员,研究人员拥有最庞大的外显子组资源,通过此次大规模样本的分析,他们揭示了小数据集无法检测到的变异特性。
为探索罕见病的致病突变打开新大门
ExAC是一个免费的、具有高分辨率编录的人类遗传变异数据库,包含了上千万个DNA变异——很多都是罕见变异,而且大多数为首次被发现,它对罕见遗传病的临床研究和诊断有重大的意义。自2014年10月对科学界放开以来,ExAC数据库的网页在线浏览量已超过五百万,使临床医生能为数千名罕见病患者提供更准确的基因诊断。
本文资深作者,Daniel MacArthur说,“ExAC的成功与多个联盟的数据共享有关。”以前的资源包含的外显子更少,且没有种族差异性,所以不足以应用至罕见病基因突变的研究中,他说,“ExAC数据库的规模和多样性是非常宝贵的,它使我们有能力发现极为罕见的突变,并为探索罕见遗传病的根源提供了一个空前的窗口。”
来自世界各地的合作机构收集完数万人的外显子原始数据后,研究人员依赖于Broad研究所的分析和计算能力生成了分辨率前所未有的人类遗传变异目录——大约每8个碱基1个变异,大多数变异从未被报道过,且非常罕见,发生的概率为1/10000。
当掌握病人的基因组,临床医生便可将患者的任何罕见突变与ExAC数据库进行比对,揭示基因或蛋白质中导致疾病的“祸根”。若患者的一些DNA突变在ExAC数据库中极其罕见,但可能对蛋白质的形成有阻碍作用,那么这些突变极有可能是导致罕见病的关键因素。
Broad临床研究测序平台医学负责人Heidi Rehm说,“ExAC资源对患者基因序列的临床评估有很大的帮助。”在临床测序中,许多DNA变异是罕见或未被研究的,因此我们无法确定它们是否对疾病风险有影响,在诊断和治疗时也无法决定是否该将其考虑在内。通过参考ExAC数据库中基因突变频率,研究人员排除了那些常见的变异,这样一来可以迅速锁定真正致病的变异,避免良性变异带来的不必要损失。
该资源还被研究人员用于确定多种新的罕见遗传病。ExAC数据库的长期用户、威康信托基金会桑格研究所的研究人员Matthew Hurles说,“ExAC数据库能够让我们使用新的统计方法来发现一些新型的严重性发育障碍。”ExAC数据库也正被研究人员用于探索基因变异带来的更加根本的影响,例如探索转录因子蛋白的突变及其对蛋白质-蛋白质相互作用的影响。
提供新见解
有趣的是,本文数据提供了一些新的见解,一些预期中的突变在分析中未被发现,一些基因含有比预期中更少的错义突变。基于大规模样本,研究人员能够量化每个基因中的这类突变,确定了多个在自然过程中被淘汰了的被“高度限制”的基因。由于不了解这些突变会导致何种疾病及其在ExAC数据库中的实际例子,“丢失的突变”意味着这些被高度限制的基因可能导致一些严重的疾病。如果临床或测序研究揭示这类基因在患者基因组中的功能缺失或错义突变,那么该基因将成为患者强有力的致病候选因素。
ExAC数据库还揭示曾经报道的上百个致病突变实际上属于良性,这将减少实验室结果为假阳性的概率。该发现展示了ExAC数据库在评估致病基因突变中的价值。
本文根据Medical网站编译,原文“Largest collection of human exome sequence data yields unprecedented tool for diagnosing rare disease”
推荐阅读: