CGI公司新论文介绍其用于高精度人类全基因组测序的信息学方法

2012-02-02 11:18 · wenmingw

Complete Genomics公司发表论文,详细介绍了该公司用于高精度人类全基因组测序数据分析的信息学方法。

Complete Genomics公司(纳斯达克:GNOM,以下简称CGI)在1月19日称Journal of Computational Biology杂志在线发表了该公司有关产生高精度人类全基因组数据的计算方法的论文。文章全文见:Computational Techniques for Human Genome Resequencing Using Mated Gapped Reads

CGI使用其特有的基于DNA纳米球阵列及组合探针-锚定连接测序法的生物化学法进行人类全基因组测序。因这些方法1可产生独特特征的读长,CGI开发出了一些新的方法,用于识别单碱基多态性(SNPs)、小片段替代(<100bp)及插入/删除。

“该论文中描述的方法可以产生非常精确的变异识别,”CGI的CEO Clifford Reid博士说道。“文章中所描述的方法在我们全部的69个基因组公共数据库及已经交付给客户的超过3800个人类基因组深度完整测序数据中都有应用。”可通过以下地址免费访问CGI的基因组数据库:https://www.completegenomics.com/sequence-data/download-data/

客户的研究论文证实了CGI的测序及生物信息学方法的有效性,这些论文的数据用于研究肺癌2、米勒综合征3、颅缝早闭4及高胆固醇血症5,并分别发表在ScienceNatureThe American Journal of Human Genetics以及Human Molecular Genetics等杂志上。2011年12月期的Nature Biotechnology刊载了CGI的测序技术与其他测序技术的对比研究结果6

CGI的方法利用了局部从头拼接技术,针对每个变异联合使用贝叶斯分析及图论技术。这种从头拼接的方法由CGI开创,此后其他公司也采用了这种方法。

CGI公司的这种合成方法使得其可以在独立的位置上识别两个等位基因,这就使得它可以在两个等位基因与参照均不一致的情况下进行复杂的识别。此外,该公司的算法尤其适用于检测彼此之间靠的很近的变异。CGI的技术也可进行目前未知的插入与缺失检测,而别的技术仅可检测某个已知的插入或缺失是否存在。在CGI交付给客户的富变异报告中就包含了这种新的见解,同时,报告还包含拷贝数变异(CNVs)、结构变异(SVs)、转座子插入以及可适用情况下的肿瘤与正常样本间的对比。CGI所交付的综合性标准数据报告减轻了合作客户的数据分析负担。

CGI持续优化其方法,不断提高其数据质量并降低数据成本,助力转化型研究领域的大范围疾病及癌症研究。“我一直在寻找方法来优化我们的算法,以便更快的进行运算并产生更为精确的数据,”负责产品开发的高级副总裁Bruce Martin说道。“目前CGI也因此而可以在不到1天的时间内绘出并组装具有高灵敏度、高特异性的基因组。”


1. Drmanac R, et al.: Human Genome Sequencing Using Unchained Base Reads on Self-Assembling DNA Nanoarrays. Science, 5 November 2009 (10.1126/science.1181498).

2. Lee W, Jiang Z, Liu J et al.: The mutation spectrum revealed by paired genome sequences from a lung cancer patient. Nature 465, 473–477 (2010).

3. Roach JC, Glusman G, Smit AFA et al.: Analysis of genetic inheritance in a family quartet by whole-genome sequencing. Science 328(5978), 636–639 (2010).

4. Nieminen P, Morgan NV, et al.: Inactivation of IL11 signaling causes craniosynostosis, delayed tooth eruption, and supernumerary teeth. The American Journal of Human Genetics - 15 July 2011 (Vol. 89, Issue 1, pp. 67–81)

5. Rios J, Stein E, Shendure J, Hobb HH,Cohen JJ et al.: Identification by whole-genome resequencing of gene defect responsible for severe hypercholesterolemina. Hum. Mol. Genet. 19(22), 4313–4318 (2010).

6. Lam HYK, Clark MJ, Chen R et al.: Performance comparison of whole-genome sequencing platforms. Nature Biotechnology. Advance online publication 18 December 2011.

关键词: