Nature Genetics:复杂疾病或由低频遗传变异决定

2010-10-09 00:00 · jack

北京时间2010年10月4日,美国加州大学伯克利分校、丹麦哥本哈根大学等单位合作的研究成果“对200个人类外显子的测序揭示大量低频率非同义突变的存在”在国际著名学术杂志Nature Genetics上。 该项研究对200个丹麦个体蛋白质编码基因的外显子组进行了深度测序,发现了大

北京时间2010年10月4日,美国加州大学伯克利分校、丹麦哥本哈根大学等单位合作的研究成果“对200个人类外显子的测序揭示大量低频率非同义突变的存在”在国际著名学术杂志Nature Genetics上。

该项研究对200个丹麦个体蛋白质编码基因的外显子组进行了深度测序,发现了大量以往未知的单核苷酸多态性位点(SNP),其中大部分在人群中都以较低频率出现。该研究完成了目前在人类外显子区域规模最大、分辨率最精细的遗传图谱,并以翔实的数据证明,人群当中的低频率多态性位点富集了大量能引起蛋白质氨基酸序列改变的变异,而这类变异在人群中受到自然选择作用,可能具有影响人类健康的功能。

最近有多项科学研究指出,以往对多基因控制的复杂疾病所进行的关联分析研究尽管从理论上可行,并在实践中发现了许多疾病关联基因,但却仅能解释复杂疾病遗传性的一小部分。这一现象被称为“遗传度缺失”,是当前复杂疾病基因组研究的一个主要难题。该研究首次证实,影响人类健康和疾病易感性的多态性位点在人群中往往频率低,但是相关位点的个数很多。既往的复杂疾病关联分析使用的基因分型芯片仅对常见多态性位点进行测定,而无法研究低频率多态性位点,从而漏掉大量疾病关联位点,造成“遗传度缺失”。该研究不仅指出了目前主流疾病研究方法的缺陷,并颠覆性地提出疾病关联分析应充分使用测序技术而非基因分型技术,从而对改变科学家对复杂疾病的研究手段,推动人类健康与医学研究的进步具有里程碑意义。

该研究是中丹合作糖尿病关联基因及变异研究(LUCAMP)项目的一部分。LUCAMP项目旨在利用新一代测序技术对1000个内脏肥胖病人和1000名对照健康人进行外显子组测序,计划将鉴定出新的与代谢疾病相关的常见突变和稀有突变。

 

英文摘要:

Nature Genetics doi:10.1038/ng.680

Resequencing of 200 human exomes identifies an excess of low-frequency non-synonymous coding variants

Yingrui Li1,19, Nicolas Vinckenbosch2,19, Geng Tian1,19, Emilia Huerta-Sanchez2,3,19, Tao Jiang1,19, Hui Jiang1, Anders Albrechtsen4, Gitte Andersen5, Hongzhi Cao1, Thorfinn Korneliussen4, Niels Grarup5, Yiran Guo1, Ines Hellman6, Xin Jin1,7, Qibin Li1, Jiangtao Liu1, Xiao Liu1, Thomas Spars?5, Meifang Tang1, Honglong Wu1, Renhua Wu1, Chang Yu1, Hancheng Zheng1,7, Arne Astrup8, Lars Bolund1,9,10, Johan Holmkvist5, Torben J?rgensen11,12, Karsten Kristiansen1,4, Ole Schmitz13,14, Thue W Schwartz15, Xiuqing Zhang1, Ruiqiang Li1,4, Huanming Yang1, Jian Wang1, Torben Hansen5,16, Oluf Pedersen5,17,18, Rasmus Nielsen2,3,4 " Jun Wang1,4

Targeted capture combined with massively parallel exome sequencing is a promising approach to identify genetic variants implicated in human traits. We report exome sequencing of 200 individuals from Denmark with targeted capture of 18,654 coding genes and sequence coverage of each individual exome at an average depth of 12-fold. On average, about 95% of the target regions were covered by at least one read. We identified 121,870 SNPs in the sample population, including 53,081 coding SNPs (cSNPs). Using a statistical method for SNP calling and an estimation of allelic frequencies based on our population data, we derived the allele frequency spectrum of cSNPs with a minor allele frequency greater than 0.02. We identified a 1.8-fold excess of deleterious, non-syonomyous cSNPs over synonymous cSNPs in the low-frequency range (minor allele frequencies between 2% and 5%). This excess was more pronounced for X-linked SNPs, suggesting that deleterious substitutions are primarily recessive.

关键词: