Reference-guided assembly

2011-06-08 12:13 · jjb

该研究属于1001基因组计划(http://1001genomes.org/projects/assemblies.html)的一部分,应用了新开发的Reference-guided 方法对四个品种the Landsberg erecta(Ler-1), C24, Bur-0,

参考基因组的作用之一,应用已有的reference 做骨架用于后期的其它个体的组装。研究显示Reference-guided assembly 将能够起到比de novo组装更加好的效果。近期PNAS的一篇关于拟南芥的paper显示出Reference-guided assembly 效果非常不错。

Reference-guided assembly of four diverse Arabidopsis thalia genomes.

PNAS-2011de novo与重测序结合.pdf
该研究属于1001基因组计划(https://1001genomes.org/projects/assemblies.html)的一部分,应用了新开发的Reference-guided 方法对四个品种the Landsberg erecta(Ler-1), C24, Bur-0, and Kro-0 illumina short reads 9 到42G 进行组装大的contig 片段。首先,应用比对reference的方法降低de novo 组装的复杂度,然后整合与reference没有相似性的reads。例如:没有中性的C24基因组有一半的被大于260kb的scaffold(最长的scaffold长度为2.2Mb)的覆盖。而且,与de novo 组装覆盖87%相比,应用Reference-guided 组装方法,超过96%的参考基因组被覆盖。应用2Mb的双脱氧序列比较显示Reference-guided 组装方法的单碱基错误率在万分之一以下。我们的组装方法提供了一张详细的,基因组范围在拟南芥个体中大范围的差异图片。我们证明了他们的现实针对性研究多态基因表达差异的分析,如果单独应用比对参考基因组的方法,展示了sRNA序列数据会导致错误的结论。

关键词: