在一项新的研究中,一个隶属于中国多个研究机构的大型遗传工程师团队完成了为中国不同祖先的人构建泛基因组参考数据的计划的第一阶段。在他们的项目中,作为中国人群泛基因组联盟(Chinese Pangenome Consortium, CPC)的一部分,该团队试图对中国各地的少数民族群体的基因组进行测序。相关研究结果于2023年6月14日在线发表在Nature期刊上,论文标题为“A pangenome reference of 36 Chinese populations”。Nature期刊的编辑们还在同期期刊上发表了一份标题为“A pangenome reference representative of 36 minority Chinese ethnic groups”的研究简报,概述了这项新的研究。
CPC是在中国创建的,以解决全球医学界出现的一个问题---大多数基因组测序都涉及来自主要人口群体的人。例如,在中国,汉族是主要的民族,所以中国的大多数基因研究都是使用汉族的基因组进行的。
这是一个问题,因为基因组的微小差异可能导致治疗失败,或在少数民族群体中造成意想不到的问题。CPC将它的工作分为几个阶段,第一阶段是选择一个少数民族群体的名单进行研究,然后对从该名单中的每个群体成员收集的组织进行测序和基因分析。
图片来自Nature, 2023, doi:10.1038/s41586-023-06173-7
在第一阶段,该团队创建了一份36个少数民族的名单(目前中国有55个已知的少数民族),并从该名单上代表的58人身上收集了组织样本。随后,他们对所有的样本进行了测序,产生了116个基因组组装(每个人两个)。他们进行了单倍型分期(haplotype phasing),按亲缘关系对这些基因组组装进行分类。他们增加了1.89亿个碱基对的组装序列,这些序列在不同个体之间存在差异。他们还发现了1367个编码蛋白的重复序列。
该团队还发现在某些序列上,不同群体之间存在相当大的差异,他们认为这证实了CPC继续开展工作的必要性。
本文转载自“生物谷”
参考文献:
[1]Yang Gao et al. A pangenome reference of 36 Chinese populations. Nature, 2023, doi:10.1038/s41586-023-06173-7.
[2]A pangenome reference representative of 36 minority Chinese ethnic groups. Nature, 2023, doi:10.1038/d41586-023-01675-w.
[3]Consortium analyzes genomic sequences for 36 minority ethnic groups in China
https://medicalxpress.com/news/2023-06-consortium-genomic-sequences-minority-ethnic.html