生物信息学、基因组学(包括功能基因组学和比较基因组学)的主要目的是研究生物基因、蛋白和基因组的结构和功能,并重构生物基因、蛋白和基因组的进化历史。序列比对是DNA和蛋白质分子进化分析、以及结构与功能研究的基本工具。目前序列比对已经有很多方法,但序列比对依然容易产生系统性偏差,导致进化分析错误,甚至造成基因、蛋白和基因组结构和功能信息的误读。一直以来,DNA和蛋白序列比对是分开进行的。学者们认为与蛋白质序列相比,相应的DNA序列中系统发育信号消失的速度更快。因此一般在氨基酸序列水平进行比对和进化分析。
最近,我们提出了一种新的序列比对和进化分析算法—DNA+Pro:将DNA和蛋白质序列组合成为“DNA -蛋白质组合序列”(CDPS),并将其用于序列比对和进化分析。理论分析和实例证明,与通常的仅用核酸或蛋白序列的方法相比,DNA+Pro算法不仅提高了序列的申农信息量理论值,而且序列间距离的估计值也具有更合理的生物学意义。通过整合和挖掘分别埋藏在DNA和蛋白质序列中的信息,提高了多序列比对的准确度,避免了在系统发育分析中普遍发生的错误,具有重要的科学意义和广泛的应用价值。该软件可免费下载使用。https://www.dnapluspro.com/