演讲题目:A Large-Scale Public Reference Set of Complete Human Genome Sequences for Biological Interpretation of Human Genomes
准确的全基因组测序提供了一个高效的方法以鉴别在疾病和表现型中体细胞和生殖细胞的变异。我们开发的技术平台和测序中心能够在一个月内以竞争性价格测序600多个人类全基因组,测序深度高(最低的为40×,较高倍数提升明显)。基于流程化方法,我们的局部突变组装分析可用于识别拷贝数变异(CNVs)、插入缺失变异(indels)、替换(substitution)以及拷贝数和结构变异,从而完成生物信息学分析。
Dr. Shan Yang
近来,该流程改进后提高了关于读取数据中位点等位不平衡的灵敏性,这一问题的诱发因素包括肿瘤样本中掺杂正常细胞、非整倍性和样本中其它异质性。针对正常细胞和肿瘤的成对样品,新开发的算法支持了详细比较每一差异位点,允许了在体细胞突变检测中同时改进和调整介于灵敏性和特异性之间的平衡。
为了帮助研究人员从常见变异和技术误差中辨别表型相关的变异,我们公布了高深度的人类全基因组数据,它们来自于NIGMS和NHGRI(CEPH/Utah、HapMap和1000个基因组项目)样本库中69个多种族的非肿瘤细胞系,样品测序覆盖都超过50×。这一性别平衡的多样性细胞系取之于欧洲人、亚洲人、非洲人和混合人种。
此外,我们还公布了ATCC典型代表的4个基因组系列(2个正常细胞和肿瘤的样品对),它们来自于接受新肿瘤测序服务的乳腺癌患者,所用的73个基因组数据已对外公布。传统方法的有效性和同一样本的HapMap对比都证实基因型的高关联性。公众数据库的详细信息和人类基因组突变研究的潜在模型有待进一步讨论。