12月12日Nature Biotechnology杂志公布了50个遗传变异数据库构建结果,这篇题为“Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes”的文章首次对栽培稻和野生稻基因组进行了大规模的遗传变异分析,这为科学家深入挖掘水稻重要农艺性状基因及促进水稻分子育种改良等研究提供了宝贵的基因资源。
国际水稻基因组计划开始于1998年,中国科学家参与了此项研究,并于2005年公布了水稻基因组序列全图,这是当时高等生物中最精确和完整的测序工作之一。然而时隔多年,随着基因组测序技术的发展,特别是成本的降低,对基因组重测序能通过不同个体的测序,分析个体差异,扫描与重要形状相关的基因序列差异和结构变异。
在这篇文章中,研究人员选取了亚洲栽培稻,这是世界上最古老的农作物物种之一,具有籼稻和粳稻两个主要亚种。在其从祖先普通野生稻驯化为栽培稻的过程中,一些与水稻产量、品质和抗逆性等相关的重要农艺性状(如穗粒、色泽、种子的休眠和出芽等)经常会发生显著性的变化。
由于这些重要农艺性状往往比较复杂,由多个基因与环境的相互作用所控制,很难通过常规的分子生物学手段进行深入了解,因此研究人员希望能通过基因组重测序,在基因组水平上解析不同栽培和野生稻基因组序列的遗传变异情况,以利于培育高产、优质和抗逆的水稻新品种,提高育种技术和水平。他们选取了具有代表性的40个栽培稻品系和10个不同地理来源的野生稻进行了全基因组重测序研究,共发现650万个单核苷酸多态性位点(SNPs);808,000个小片段(1-5bp)的插入/缺失,其中大部分为稀有突变;94,700个长片段(>100bp)的结构变异和1.676个拷贝数变异(CNVs)。
基于这些遗传变异数据,研究人员还发现了数千个与人工选择相关的候选基因,其中有些基因与水稻的农艺性状具有重要的相关性,而大部分基因的功能尚不清楚。但是据科研人员推测,这些未知功能的基因也可能与水稻的相关农艺性状具有重要关联。
这项研究将有助于更加全面地了解了水稻全基因组的遗传变异特征,同时,种群结构和系统进化分析结果也从全基因水平上追溯了水稻的驯化历史,并证明籼稻和粳稻的起源的确是独立的,而且粳稻起源于中国普通野生稻。接下来,研究人员还将进行进一步的研究,希望能为水稻育种改良等研究提供指导作用。
全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。基因组的重测序可以辅助研究者发现单核苷酸多态性位点(SNPs)、拷贝数变异(Copy Number Variation, CNV)、插入(Insertion)、缺失(Deletion)等变异类型,以最廉价的方式将单个参考基因组信息扩增为生物群体的遗传特征。短序列(Short-Reads)与双末端(Paired-End),以及不同插入长度双末端的组合,使我们能够更深入地了解到序列和序列以外的基因组结构变异。

Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes
Xun Xu, Xin Liu, Song Ge, Jeffrey D Jensen, Fengyi Hu, Xin Li, Yang Dong, Wen Wang
Rice is a staple crop that has undergone substantial phenotypic and physiological changes during domestication. Here we resequenced the genomes of 40 cultivated accessions selected from the major groups of rice and 10 accessions of their wild progenitors (Oryza rufipogon and Oryza nivara) to >15 × raw data coverage. We investigated genome-wide variation patterns in rice and obtained 6.5 million high-quality single nucleotide polymorphisms (SNPs) after excluding sites with missing data in any accession. Using these population SNP data, we identified thousands of genes with significantly lower diversity in cultivated but not wild rice, which represent candidate regions selected during domestication. Some of these variants are associated with important biological features, whereas others have yet to be functionally characterized. The molecular markers we have identified should be valuable for breeding and for identifying agronomically important genes in rice.
文献链接:https://www.nature.com/nbt/journal/vaop/ncurrent/full/nbt.2050.html
