尽管核酸序列测定方法越来越成熟、简便并且可以自动化,但事实上,对于一个片段较长、序列未知的待测核酸而言,仍然是一件耗时且繁琐的工作。对于一个待测DNA分子,要制定一个能够简捷准确的测定方案,一般可以从以下几个方面考虑:
⑴ DNA片段大小。
⑵ 背景资料:是否清楚DNA限制性酶切图谱,是否有一段已知序列,是否具有重复序列等。
⑶ 测序目的:①测定未知序列;②确定重组DNA的方向与结构;③对突变(如点突变)进行定位和鉴定;④比较性研究,如比较同种病毒不同株系之间的基因差异。后3种测序目的称为确证性测序。
⑷ 实验条件:如手工测序还是自动化测序,合成引物费用等。
由于单套测序反应所能准确测定的DNA序列最长一般仅400~500bp。因此,在进行序列测定之前,必须首先考虑待测DNA分子的大小,其次是所要测定的序列范围以及要求的序列精确程度等,再结合实验室的条件选择切实可行的克隆及测序方案。
㈠ 确证性测序策略
多数情况下,测序是对已知序列的次级克隆进行鉴定和证实(即确证性测序),如次级克隆DNA的插入方向、定点突变的检测、删切产物的鉴定和待表达基因阅读框架的调整等。这类DNA片段通常较小,只需了解两端的部分序列即可。所以只需直接克隆到M13mp或者质粒载体中,进行单链或双链模板测序。对于一个稍大的DNA片段的确证性测序,可以利用通用引物分别从两端开始双向测序,再通过中间重迭部分拼出全序列。对于更大的的DNA序列,可以在序列适当区段增加一个或数个测序引物,分别测序再拼出全序列。
㈡ 未知DNA序列的测定策略
未知DNA序列的测定是指确定一个未知序列的准确长度及核苷酸排列顺序。未知DNA序列的测定,复杂而费时。目前已发展了一些可行的策略。
对于较小的目的DNA片段(如小于400bp),可以利用直接利用M13mp或质粒系统(如pUC18等)克隆、测序。随着质粒DNA序列测定技术的改进,目前其测序水平基本上已达到M13mp单链DNA测序水平,利用质粒载体系统具有显著的优势。因此,除非有特殊用途,如体外定点突变,都可以用pUC系统代替M13mp系统进行克隆测序。
如果是数千个碱基的大片段未知序列DNA,且要求精确测定其整个序列,就必需将其切割成适当大小的各个片段(300~400bp)分别进行次级克隆再进行测序,最后拼出全序列。可以考虑以下几种方法:
1. 随机克隆法或称鸟枪法 这是一种传统的方法,即利用DNaseⅠ或超声波,将目的DNA大片段随机切割成小片段,并分别进行亚克隆,然后再测定亚克隆的序列,通过排列分析,可获得目的DNA的全序列。但由于用于测序的克隆是随机挑选出来的,因此某些区段往往被重复测定,有时需要很长时间才能确定最后几个亚克隆的序列而拼出全序列。
2.限制性酶切片段亚克隆法 首先需要对目的DNA进行酶切分析确定其酶切图谱。再选择合适的限制性酶消化以制备各种不同长度的限制性酶切片段,并亚克隆到测序载体上建立亚克隆库。然后分别测定各个亚克隆的核苷酸序列,通过排列分析,即可获取目的DNA的全序列。但实际上应用此法相当不易,仅当目的DNA片段上限制性酶切位点分布较均匀、且片段不大情况下,可考虑用此策略。
3.定向连续次级克隆 大片段未知DNA序列片段的定向连续次级克隆法,亦称嵌套系列缺失突变体法,是目前常用的一种策略,此法具有节省工作量、便于拼读等优点。这些次级克隆具有其同的缺失起点(通常在目的DNA的一端),并逐步延伸到目的序列不同距离。从而使目的DNA中较远距离的序列逐渐地进入了通用引物的测序范围之内。目前,利用核酸外切酶Ⅲ和核酸酶BAL31构建连续次级克隆的方法比较成熟。