通过外源DNA的重组、克隆、以及鉴定,可以获得所需的特异DNA克隆。外源克隆基因在某种表达载体及适宜的宿主细胞中可表达为相应的蛋白质,这就组成了外源基因的蛋白表达系统。表达后的蛋白质必须具有原来的生物学活性,这是基于正确的基因转录、转录后加工、mRNA翻译及翻译后修饰,同时与表达载体的结构和表达体系有关。在蛋白质表达领域,表达体系的建立包括表达载体的构建、受体细胞的建立及表达产物的分离、纯化等技术。可分为原核表达体系和真核表达体系。
一、原核表达体系
大肠杆菌表达系统是目前采用最多的原核表达体系,因其培养简单、生长迅速、成本较低而又适合大规模生产。人类胰岛素、生长激素、人干扰素等基因在大肠杆菌中的表达便是一系列成功的例子。这些原核表达体系往往表达一些真核基因,这是比较简单而且实用的方法,但对于外源基因、表达载体等都有一定的要求,分别叙述如下:
(一)对外源目的基因的要求
原核生物缺乏真核生物转录后的加工系统,不能切除内含子形成成熟的mRNA;同时原核生物也缺乏真核生物翻译后的加工系统,所以真核生物的目的基因不应具有5’端非编码区以及内含子结构,只编码成熟的蛋白质或多肽。因此真核生物的目的基因可通过mRNA逆转录成cDNA,用cDNA文库筛选来制备;同样可以cDNA为模板,设计两条引物,进行PCR扩增目的基因,用于克隆表达,这是一个简单、实用的方法;也可通过化学方法、酶法、DNA合成仪人工合成目的基因,但由于费用昂贵,一般用于合成较短的目的基因。
(二)原核表达载体
利用大肠杆菌表达蛋白质所使用的表达载体必须具有以下特点:¬含大肠杆菌适宜的选择标志;具有能调控转录、生产大量mRNA的启动子,例如Lac启动子,色氨酸(trp)启动子或其他启动子序列;®含适当的翻译调控序列,如核糖体结合位点(Shine-Dalgarno ,SD序列),和翻译起始点和终止序列等;¯含合理设计的多接头克隆位点,以确保目的基因按一定的方向与载体正确连接。
(三)真核生物基因在原核细胞中的表达
真核基因要在大肠杆菌中进行表达,一般情况下,将目的基因插入适当表达载体以后,经过转化、筛选得到正确的含转化基因的细菌就可以直接用于蛋白质的表达。这样产生的蛋白质包括融合型表达蛋白和非融合型表达蛋白和分泌型表达蛋白。
1.非融合型表达蛋白
是不与细菌任何蛋白或多肽融合在一起的表达蛋白,其优点是和真核生物体内蛋白质结构最相似,功能最相近;缺点在于容易被细菌蛋白酶所破坏。常用的非融合型表达蛋白表达原核载体pKK223-3 是一个含tac启动子的表达载体,tac启动子是来源于Lac和trp的一杂合启动子,但比Lac和trp都强得多,是一个非常强的启动子,它受Lac阻遏蛋白的负调节,可被IPTG诱导。在大肠杆菌细胞中,它能高表达外源基因。这个载体由pBR322构建,具有以下特点:¬含抗氨苄青霉素基因,可以作为筛选的标记;tac¯AUG起始密码,位于SD序列下游8个核苷酸处;来源于λ噬菌体的转录终止序列T1和T2,以避免其他RNA的过度转录。外源基因插入Ncol、PstI或HindⅢ位点(位于SD序列和终止序列之间),诱导表达后,mRNA可高效翻译。使用这个表达载体时,可相应lacI宿主,例如大肠杆菌JM105,一般情况下此载体的启动基因被阻遏,在适当的时候,加入IPTG可解除阻遏。启动子;SD序列;
2.融合型表达蛋白
指蛋白质的N端由原核生物的DNA序列或其他DNA序列编码,C端由真核生物DNA序列编码。产生的融合蛋白是一条较短的原核生物多肽和真核生物蛋白质结合而成,融合蛋白具有抗原性可以作为抗原,同时可以抵御细菌蛋白酶的破坏,融合蛋白比天然的外源蛋白更加稳定这是融合蛋白最大优点。为了正确表达,外源基因的阅读框架必须与原核基因的阅读框架相符合。由于融合蛋白的转录和翻译起始从正常的大肠杆菌序列开始,可产生高水平的融合蛋白。有的融合蛋白带有信号肽。可以分泌到细胞外,这有助于蛋白质的分离和纯化。
在融合蛋白表达以后,融合蛋白中原核多肽必须去除,常用的方法有化学裂解法和酶解法,是基于表达蛋白质的氨基酸的组成、序列和理化性质而建立的对融合蛋白进行位点特异裂解方法。
常用的融合型表达蛋白原核表达载体pET系列,如pET-3a是一个含T7噬菌体φ10启动子(pφ10)和φ终止序列(Tφ)的表达载体,T7噬菌体启动子是只为T7噬菌体的RNA聚合酶识别的启动子,T7RNA聚合酶所启动的转录非常强大,宿主细胞的RNA聚合酶所进行的转录无法与其竞争,使宿主细胞中的几乎所有转录都由T7RNA聚合酶操纵,可完整转录在T7启动子控制下的所有的DNA序列。T7噬菌体启动子对外源基因的高效表达是近年来较常采用的表达载体,根据外源基因插入的位点可以分别得到直接表达和融合表达。pET-3a具有以下特点:¬带有T7噬菌体φ10启动子(pφ10)和φ终止序列(Tφ);插入了噬菌体φ10(T7噬菌体的主要衣壳蛋白)的翻译起始区(S10),其中在第11密码子处有BamH I 位点,外源基因在BamH I位点插入,与φ10蛋白的N端形成融合蛋白;®当外源基因按正确的阅读框架插入到Nde I 位点,可表达天然外源蛋白。
3.分泌型表达
为了减少外源蛋白质在大肠杆菌中被蛋白酶降解,或者是蛋白质能够在体外正确折叠并且易于提取,必须将融合蛋白构成带有一些信号肽,使融合蛋白转移到细胞适合的位置。因此必须要用分泌型载体。表达分泌蛋白是防止大肠杆菌对表达产物的降解,减轻大肠杆菌代谢负荷和恢复表达产物天然构象的有力措施。
常用的分泌型表达蛋白原核表达载体PINⅢ,其带有大肠杆菌很强的脂蛋白基因(IPP)启动子;在启动子的下游装有LacUV-5的启动子及操纵基因,LacUV-5的启动子是一个突变的乳糖启动子,对分解代谢抑制不敏感,即使在没有CAP-cAMP的性况下,转录也能正常进行。 带有Lac阻遏基因(LacI,用于调节目的基因的表达);大肠杆菌中分泌蛋白基因—外膜蛋白基因(ompA,编码载体中的信号肽顺序)。信号肽编码序列下游是3个酶切位点EcorI、HindIII和BamHI。表达产物通过细菌膜被准确加工后,分泌到细胞间隙或细菌培养液中,有利于形成蛋白正确的结构。
(四)包涵体
1.包涵体的形成
包涵体(inclusion body)是大肠杆菌高效表达外源基因时形成的由膜包裹的高密度、不溶性蛋白质颗粒,在显微镜下观察时为高折射区,与细胞质中的其他成分有明显的区别。包涵体是由于细胞内蛋白质表达部位的低电势,或者重组蛋白质分子的无糖、低电荷等特殊结构,都促使重组蛋白质与细菌杂蛋白、核酸等成分所形成的不溶性聚合体。包涵体的形成有利于防止蛋白酶对表达蛋白的降解,以及有利于分离表达产物。但是包涵体形成后,表达蛋白不具有生物活性,因此必须溶解包涵体并对表达蛋白进行复性。
通过外源DNA的重组、克隆、以及鉴定,可以获得所需的特异DNA克隆。外源克隆基因在某种表达载体及适宜的宿主细胞中可表达为相应的蛋白质,这就组成了外源基因的蛋白表达系统。表达后的蛋白质必须具有原来的生物学活性,这是基于正确的基因转录、转录后加工、mRNA翻译及翻译后修饰,同时与表达载体的结构和表达体系有关。在蛋白质表达领域,表达体系的建立包括表达载体的构建、受体细胞的建立及表达产物的分离、纯化等技术。可分为原核表达体系和真核表达体系。
一、原核表达体系
大肠杆菌表达系统是目前采用最多的原核表达体系,因其培养简单、生长迅速、成本较低而又适合大规模生产。人类胰岛素、生长激素、人干扰素等基因在大肠杆菌中的表达便是一系列成功的例子。这些原核表达体系往往表达一些真核基因,这是比较简单而且实用的方法,但对于外源基因、表达载体等都有一定的要求,分别叙述如下:
(一)对外源目的基因的要求
原核生物缺乏真核生物转录后的加工系统,不能切除内含子形成成熟的mRNA;同时原核生物也缺乏真核生物翻译后的加工系统,所以真核生物的目的基因不应具有5’端非编码区以及内含子结构,只编码成熟的蛋白质或多肽。因此真核生物的目的基因可通过mRNA逆转录成cDNA,用cDNA文库筛选来制备;同样可以cDNA为模板,设计两条引物,进行PCR扩增目的基因,用于克隆表达,这是一个简单、实用的方法;也可通过化学方法、酶法、DNA合成仪人工合成目的基因,但由于费用昂贵,一般用于合成较短的目的基因。
(二)原核表达载体
利用大肠杆菌表达蛋白质所使用的表达载体必须具有以下特点:¬含大肠杆菌适宜的选择标志;具有能调控转录、生产大量mRNA的启动子,例如Lac启动子,色氨酸(trp)启动子或其他启动子序列;®含适当的翻译调控序列,如核糖体结合位点(Shine-Dalgarno ,SD序列),和翻译起始点和终止序列等;¯含合理设计的多接头克隆位点,以确保目的基因按一定的方向与载体正确连接。
(三)真核生物基因在原核细胞中的表达
真核基因要在大肠杆菌中进行表达,一般情况下,将目的基因插入适当表达载体以后,经过转化、筛选得到正确的含转化基因的细菌就可以直接用于蛋白质的表达。这样产生的蛋白质包括融合型表达蛋白和非融合型表达蛋白和分泌型表达蛋白。
1.非融合型表达蛋白
是不与细菌任何蛋白或多肽融合在一起的表达蛋白,其优点是和真核生物体内蛋白质结构最相似,功能最相近;缺点在于容易被细菌蛋白酶所破坏。常用的非融合型表达蛋白表达原核载体pKK223-3 是一个含tac启动子的表达载体,tac启动子是来源于Lac和trp的一杂合启动子,但比Lac和trp都强得多,是一个非常强的启动子,它受Lac阻遏蛋白的负调节,可被IPTG诱导。在大肠杆菌细胞中,它能高表达外源基因。这个载体由pBR322构建,具有以下特点:¬含抗氨苄青霉素基因,可以作为筛选的标记;tac¯AUG起始密码,位于SD序列下游8个核苷酸处;来源于λ噬菌体的转录终止序列T1和T2,以避免其他RNA的过度转录。外源基因插入Ncol、PstI或HindⅢ位点(位于SD序列和终止序列之间),诱导表达后,mRNA可高效翻译。使用这个表达载体时,可相应lacI宿主,例如大肠杆菌JM105,一般情况下此载体的启动基因被阻遏,在适当的时候,加入IPTG可解除阻遏。启动子;SD序列;
2.融合型表达蛋白
指蛋白质的N端由原核生物的DNA序列或其他DNA序列编码,C端由真核生物DNA序列编码。产生的融合蛋白是一条较短的原核生物多肽和真核生物蛋白质结合而成,融合蛋白具有抗原性可以作为抗原,同时可以抵御细菌蛋白酶的破坏,融合蛋白比天然的外源蛋白更加稳定这是融合蛋白最大优点。为了正确表达,外源基因的阅读框架必须与原核基因的阅读框架相符合。由于融合蛋白的转录和翻译起始从正常的大肠杆菌序列开始,可产生高水平的融合蛋白。有的融合蛋白带有信号肽。可以分泌到细胞外,这有助于蛋白质的分离和纯化。
在融合蛋白表达以后,融合蛋白中原核多肽必须去除,常用的方法有化学裂解法和酶解法,是基于表达蛋白质的氨基酸的组成、序列和理化性质而建立的对融合蛋白进行位点特异裂解方法。
常用的融合型表达蛋白原核表达载体pET系列,如pET-3a是一个含T7噬菌体φ10启动子(pφ10)和φ终止序列(Tφ)的表达载体,T7噬菌体启动子是只为T7噬菌体的RNA聚合酶识别的启动子,T7RNA聚合酶所启动的转录非常强大,宿主细胞的RNA聚合酶所进行的转录无法与其竞争,使宿主细胞中的几乎所有转录都由T7RNA聚合酶操纵,可完整转录在T7启动子控制下的所有的DNA序列。T7噬菌体启动子对外源基因的高效表达是近年来较常采用的表达载体,根据外源基因插入的位点可以分别得到直接表达和融合表达。pET-3a具有以下特点:¬带有T7噬菌体φ10启动子(pφ10)和φ终止序列(Tφ);插入了噬菌体φ10(T7噬菌体的主要衣壳蛋白)的翻译起始区(S10),其中在第11密码子处有BamH I 位点,外源基因在BamH I位点插入,与φ10蛋白的N端形成融合蛋白;®当外源基因按正确的阅读框架插入到Nde I 位点,可表达天然外源蛋白。
3.分泌型表达
为了减少外源蛋白质在大肠杆菌中被蛋白酶降解,或者是蛋白质能够在体外正确折叠并且易于提取,必须将融合蛋白构成带有一些信号肽,使融合蛋白转移到细胞适合的位置。因此必须要用分泌型载体。表达分泌蛋白是防止大肠杆菌对表达产物的降解,减轻大肠杆菌代谢负荷和恢复表达产物天然构象的有力措施。
常用的分泌型表达蛋白原核表达载体PINⅢ,其带有大肠杆菌很强的脂蛋白基因(IPP)启动子;在启动子的下游装有LacUV-5的启动子及操纵基因,LacUV-5的启动子是一个突变的乳糖启动子,对分解代谢抑制不敏感,即使在没有CAP-cAMP的性况下,转录也能正常进行。 带有Lac阻遏基因(LacI,用于调节目的基因的表达);大肠杆菌中分泌蛋白基因—外膜蛋白基因(ompA,编码载体中的信号肽顺序)。信号肽编码序列下游是3个酶切位点EcorI、HindIII和BamHI。表达产物通过细菌膜被准确加工后,分泌到细胞间隙或细菌培养液中,有利于形成蛋白正确的结构。
(四)包涵体
1.包涵体的形成
包涵体(inclusion body)是大肠杆菌高效表达外源基因时形成的由膜包裹的高密度、不溶性蛋白质颗粒,在显微镜下观察时为高折射区,与细胞质中的其他成分有明显的区别。包涵体是由于细胞内蛋白质表达部位的低电势,或者重组蛋白质分子的无糖、低电荷等特殊结构,都促使重组蛋白质与细菌杂蛋白、核酸等成分所形成的不溶性聚合体。包涵体的形成有利于防止蛋白酶对表达蛋白的降解,以及有利于分离表达产物。但是包涵体形成后,表达蛋白不具有生物活性,因此必须溶解包涵体并对表达蛋白进行复性。
2.包涵体的分离与纯化
细胞破碎时提取细胞内产物的关键。对于细菌的裂解常用的有酶溶法、超声破碎法、化学渗透法、玻璃珠研磨等。包涵体可通过超声波、匀浆等常规的方法是菌体破碎后,离心就可得到。密度梯度离心后可得到高纯度的包涵体。包涵体一般不溶于水,为了获得可溶性的蛋白质可加入强蛋白质变性剂后使其溶解。一般有盐酸胍(5~8mmol/L)、尿素(5~8mmol/L)等,也可用酸性溶液直接溶解包涵体,使非共价聚集的蛋白质分子间分离;若包涵体内蛋白质多肽链中含有半胱氨酸时,可采用低pH值加含巯基的试剂巯基乙醇或二硫苏糖醇和适量的SDS,使蛋白质完全还原,呈溶解状态。
3.包涵体的复性
包涵体中蛋白质必须恢复其生物活性,称为包涵体蛋白质的复性,通过逐步降低变性剂浓度,可使表达蛋白恢复其天然构型。复性效率与蛋白质的纯度和浓度、残留变性剂的浓度、复性时溶液的pH值、离子强度、温度等许多因素有关。常用的复性的方法有逐步稀释法或透析。
大肠杆菌表达系统在实际应用中存在着一些不足之处,由于缺乏转录加工的机制,因此只适合表达克隆的cDNA, 不宜表达真核基因组DNA;由于缺乏适当的翻译后加工机制,大肠杆菌表达系统表达的真核蛋白质不能形成一定的折叠、修饰,只适宜表达翻译后不需进行加工的真核蛋白,或不进行翻译后加工不影响生物学活性的真核蛋白;大肠杆菌表达系统表达的真核蛋白质往往形成不溶性的包涵体,需经过变性、复性处理,才能恢复生物学活性;利用大肠杆菌的分泌信号,可将外源蛋白分泌到细胞间隙或细菌培养液中,但很难大量表达分泌性蛋白,产量不高;表达的真核蛋白在原核细胞中不稳定,容易被细菌蛋白酶破坏。
二、真核表达体系
与原核表达体系相比,真核表达体系如酵母、昆虫及哺乳类动物细胞表达体系显示了较大的优越性。
(一)酵母表达体系
酵母表达系统中最常用的啤酒酵母,酵母是单细胞真核生物,具有真核细胞的特点,可以对蛋白进行多种翻译后修饰,如蛋白的糖基化;能进行所设计的翻译后修饰,例如正确的二硫键的形成和信号肽的蛋白质水解;酵母的培养简单,无需特殊的培养基,培养基中没有蛋白质的加入;酵母自身的分泌蛋白很少,能把外源基因产生的蛋白质分泌到培养基中,便于分离纯化,是一个理想的分泌型表达系统;啤酒酵母具有较高的安全性,没有内毒素,无致病性。现在已分离得到几个较强的酵母基因启动子,可以调控基因进行高效表达;总之,酵母表达系统具有一个产量高,分泌型的特点,先后成功表达了多种干扰素、人表皮生长因子、人乙型肝炎表面抗原和核心抗原等。
1.酵母表达载体
是在酵母克隆载体的基础上带上一定的表达结构而成的。一般情况下表达载体均是质粒型,并且是穿梭载体,即它们都含有在酵母细胞和大肠杆菌细胞中发挥作用的可选择遗传标志和复制子。这些穿梭载体再插入一些表达结构包括酵母启动子和一个或多个供外源蛋白质编码序列插入的限制性酶切位点,转录的起始序列、转录终止序列和编码有用的蛋白质结构域的序列。
(1)选择性标志: 选择性标志通常选用的是野生型基因,如URA3、LEU2、HIS3和TRP1。这些基因可以补偿酵母细胞某一特定的代谢缺陷(营养缺陷)。这些标志和细菌质粒中的抗生素标记不同,它们必须与具有可被互补的适当突变宿主菌株结合。这些选择性标志基因往往插入大肠杆菌质粒载体中构成整合型质粒。
(2)复制子: 大多数酵母表达载体源于2μm环的克隆载体。2μm环是一种在酿酒酵母中天然存在的一种内源性质粒DNA,是1967年美国芝加哥大学的Sinelari发现的,长度为2μm。2μm质粒一般存在与细胞核中,在每个细胞中平均拷贝数是50-100,能稳定存活于细胞中,它的复制和染色体的复制通常是同步的,都发生S期。带2μm环的克隆载体是在整合型质粒插入2μm质粒的复制起始点构成的。
(3)常用的启动子: 外源基因在酵母细胞中表达,在酵母克隆载体的基础上,一定要带有酵母基因的启动子,常用的酵母基因启动子有:醇脱氢酶,磷酸甘油酸激酶,3-磷酸甘油醛脱氢酶,蔗糖酶,酸性磷酸酯酶和酵母交配因子(MFα)。
(4)上游活性序列: 酵母各类基因中,它的上游普遍存在着一段活性序列,它的作用类似于哺乳动物细胞基因的增强子。上游活性序列位于转录起始点上游几百个碱基处,它的激活能促进转录。
(5)终止序列: 在酵母表达载体在启动子和克隆位点均含有翻译的终止学列,它可引起RNA聚合酶II终止转录。另外更重要的是,启动子下游转录终止序列的出现可增加mRNA的数量和蛋白质表达的总量。
(6)有用的蛋白结构域: 许多表达载体在启动子的下游带有编码有用蛋白质结构域的DNA序列。这些结构域有:信号肽序列,可引导表达产物分泌到细胞外培养基中;核定位序列,可引导表达产物运送到细胞核中。
2.酵母表达外源性基因的形式
酵母表达外源性基因的形式有直接表达和分泌性表达二种。直接表达外源性蛋白是指外源蛋白质表达后积累于酵母细胞质中不分泌出来。比较成功的例子是人乙型肝炎表面抗原在酵母细胞内的表达。分泌性表达是指蛋白质在酵母细胞中表达后,为了便于糖基化以及纯化的方便,往往利用一些酵母分泌型表达载体最终能产生信号肽,将外源蛋白质分泌于细胞外或培养基中,实现外源表达基因的分泌。这些分泌型表达载体带有的分泌信号序列通常是带有α因子前导序列的,它以酵母细胞为受体细胞,组成酵母外源性蛋白分泌表达系统。α因子是由13个氨基酸残基组成的多肽。它首先一前体的形式表达,这个前体由165个氨基酸组成,包括89个氨基酸组成的信号肽,信号肽的分泌、表达可以介导外源性蛋白的分泌表达。因此,将编码α因子信号肽的DNA片段插入在一个适合的酵母启动子的下游,构建酵母细胞分泌表达系统。
(二)哺乳动物细胞表达体系
哺乳动物细胞表达系统是指采用某种方式将外源基因导入细胞,在哺乳动物细胞中表达获得一定的有用的蛋白质,这一类真核基因的表达系统称为哺乳动物细胞表达系统。哺乳动物细胞不仅可以表达克隆的cDNA,而且还可以表达真核基因组的DNA;哺乳动物细胞表达的蛋白通常可以被适当的修饰,而且表达的蛋白质回恰当地分布在细胞的一定区域并积累。哺乳动物细胞表达系统的最大缺点是操作技术难、费时、不经济。
1.常用的哺乳动物细胞表达载体
有SV40病毒表达载体、痘病毒表达载体、逆转录病毒表达载体,常见的哺乳动物表达载体的组成成分有:原核DNA序列、启动子、增强子、拼接信号、终止信号和多聚腺苷酸化信号、筛选标记及真核病毒序列等。
(1)原核DNA序列: 为了能在大肠杆菌中增殖,得到大量能转染哺乳动物细胞的重组DNA,不哺乳动物表达载体中通常有一段原核序列,包括一个能在大肠杆菌中自身复制的复制子,便于挑选含重组DNA细菌的抗生素抗性基因,以及便于把真核序列插入载体的少数单一限制性酶切位点。当具备这些序列以后,外源的真核基因序列可由单一酶切位点插入载体中,形成的重组DNA可在大肠杆菌中增殖,经抗生素筛选后进行DNA提取,即可得到大量的所需的哺乳动物细胞表达载体。
(2)启动子: 真核生物的启动子区域位于TATA区上游100bpd到230bp之间,TAT区位于转录起始点上游25-30bp处。启动子的转录销路因细胞而异。因此需根据宿主细胞类型选择不同的启动子。
(3)增强子: 增强子是使启动子的基因转录效率显著提高的一类顺式作用元件,有多个独立核苷酸序列组成。它们的作用通常不具有方向性,在位于转录起始点的下游或离启动子很远是仍有活性。许多增强子只能在特定的组织或细胞中起作用,即具有组织细胞的特异性,因此在构建真核表达载体的时候,应根据宿主细胞来选择增强子。
(4)剪接信号: 真核基因由许多内含子和外显子组成。被转录成mRNA前体以后,需通过剪除内含子、连接外显子才能成为成熟的mRNA。一般mRNA拼接需要的基本序列位于内含子的5’和3’末端,因此,改变拼接位点5’和3’末端两侧的外显子序列可能回影响邻近拼接位点的使用效率,在替换外显子是应注意。
(5)终止信号和多聚腺苷化的信号: 转录的终止信号常常位于多聚腺苷化位点下游的一端长度为几百个核苷酸碱基的DNA区域内。多聚腺苷化需要两种序列:位于腺苷化位点下游的GU丰富区或U丰富区和位于腺苷化位点上游11-30个核苷酸处的一个有6个核苷酸碱基组成并高度保守的AAUAAA序列。为了保证目的mRNA能有效地多聚腺苷化,真核表达载体上必须包括多聚腺苷化下游的一端序列。最常用的方法是用SV40的一端237bp长的BamHⅠ- BclI 限制性片段,含有多聚腺苷化的信号。另一种的方法是将全长 cDNA与已组装在表达载体上一个顺式作用因子的部分片段融合,提供多聚腺苷化的信号。
(6)遗传标记: 从成千上万个哺乳细胞中,检测出极少数的含DNA重组体的转染细胞,并鉴定已导入外源DNA是哺乳动物细胞基因表达系统的一个关键内容。因此,在真核生物表达载体上必须附有标记基因,才能进行筛选。常用的标记基因有:胸苷激酶基因(thymidine kinase,TK)、二氢叶酸还原酶基因(dihydrofolate reductase,DHFR)、氯霉素乙酰转移酶基因(chloramphenicol acetyltransferase,CAT)、新霉素抗性基因(neomycin resistance,NEO)等。
例如新霉素是细菌的抗生素,它可以干扰原核生物的核糖体,使蛋白质合成不能正常进行,而真核细胞核糖体不受新霉素的影响。新霉素的一种类似物G418对真核细胞和原核细胞均有毒性。细菌的新霉素抗性基因与能有效转录的真核DNA序列连锁时,就能在真核细胞中获得有效的表达。NEO基因编码的磷酸转移酶能使G418失活。所以,当细胞表达了这种NEO抗性基因以后就会在含有G418的选择培养基中存活,这种选择系统适用于所有的细胞类型。
2.常用的外源基因转染哺乳动物细胞的方式
常用的外源基因转染哺乳动物细胞的方式有许多。
不同哺乳动物细胞转染方式及应用
细胞系
DNA转染方式
最初的应用
CV-1
SV40病毒感染
表达野生型、突变蛋白
CV-1/293
腺病毒感染
表达野生型、突变蛋白
COS
瞬时DEAE-葡聚糖
在哺乳类细胞中表达,快速鉴定cDNA克隆,表达突变蛋白。
3T3
逆转录病毒感染
转基因动物,在不同类型细胞中表达
鼠成纤维细胞MOP
瞬时DEAE-葡聚糖
快速鉴定cDNA克隆表达突变蛋白
CHO-DHFR
稳定DHFR+转染
用氨甲喋呤扩增
高效稳定表达
灵长/啮齿类
痘病毒
疫苗
神经元细胞
EB病毒载体
HSV病毒载体
克隆表达
基因转移
3.哺乳动物细胞的瞬时表达和稳定表达系统
在哺乳动物细胞表达系统中比较具有代表性的是COS细胞瞬时表达系统和中国仓鼠卵巢细胞(Chinese hamster overy cell,CHO)的稳定表达系统。
(1)COS细胞瞬时表达系统: 由COS细胞系和带有SV40复制起始点(SV40 ori)的表达载体组成的。
SV40病毒染宿主细胞后,SV40病毒的早期基因产物—大T抗原作为反式因子与SV40 ori 结合,使宿主细胞的DNA聚合酶不断复制病毒DNA,最后的结果是在宿主细胞感染48小时后,病毒基因组可扩增1000倍。因此,以SV40病毒基因组100bp长的SV40 ori 为基础构建了表达载体,宿主细胞选用COS细胞。
COS细胞源于非洲绿猴细胞系(CV-1)。CV-1细胞经复制起始区缺陷的SV40病毒基因组转化后,产生能表达SV40的大T抗原的COS细胞株。此细胞株除了能持续SV40的大T抗原外,还含有启动带有SV40 ori 的质粒进行复制所必须的所有细胞因子。这样转染到COS细胞的带有SV40 ori 的质粒就可进行快速扩增。每个COS细胞将积累<105个带有SV40 ori 的重组表达质粒,并高效表达外源DNA基因。由于转染的质粒不受约束地复制,直到细胞不能忍受如此大量的DNA在它的染色体外进行复制,最终导致死亡,所以这一系统是瞬时表达系统。
在COS细胞中的表达载体,除了SV40 ori序列以外,还必须含有以下结构:原核DNA复制起始点(ori)及原核可选择性标记,以便表达载体与质粒的构建及在细菌中增殖;真核细胞蛋白质表达元件:包括启动子、增强子、转录后加工的信号序列(能有效得加上polyA)、内含子(带有剪接供体和剪接受体的功能位点)以及转录终止信号序列。以保证真核基因的有效表达;设计一定的限制性内切酶的位点,以便外源目的基因的插入。
pMT2是一个带有SV40ori的瞬时表达载体,见图7-16,可以在COS 细胞中进行瞬时表达。
(2)COS细胞瞬时表达系统的应用: COS细胞瞬时表达系统是研究哺乳类细胞基因表达调控的简便方法。某些原核或真核基因可作为测定哺乳类基因启动子转录活性的基因,将要测定的真核基因表达的调控区克隆与这些基因前,通过研究在不同情况下这些基因的表达水平,来分析基因的表达调控机制。分离编码蛋白质的cDNA是COS细胞瞬时表达系统最有用的作用。从以哺乳类细胞表达载体为基础而制备的cDNA文库中分离分泌蛋白质的编码cDNA,可按以下步骤进行:
带SV40 ori的表达载体在COS细胞中转染以后可得到高水平表达的蛋白质。回收、分析,可用做生物试剂,并可用作蛋白质结构与功能的研究。并可作为对组建的真核基因表达载体的快速评估系统
(3)CHO细胞稳定表达系统:动物细胞瞬时表达系统中外源基因没有稳定地整合到宿主细胞染色体中,一染色体外DNA的形式存在。因而只能瞬时表达。要使外源基因在宿主细胞中高效、稳定地表达,必须建立一个稳定表达系统,包括适宜的表达载体、有效的基因转染、标记基因和目标基因的选择与共扩增、受体适当的受体细胞和培养条件。现以pMT2为载体,二氢叶酸还原酶(DHFR)未标记基因, CHO细胞为受体细胞,介绍哺乳动物细胞稳定表达系统。
pMT2在哺乳动物细胞稳定表达系统中和瞬时表达系统中有所不同,区别在此表达载体中含有鼠的DHFR基因序列,作为选择标记基因,并在动物细胞内可进行扩增。pMT2表达载体既可在瞬时表达系统中起作用,又可在稳定表达系统中稳定表达外源基因。
选择性标记基因的作用就是为带有外源基因的哺乳动物细胞提供选择标记。作为选择性标记基因必须和目的基因一起转染细胞,并在细胞中进行扩增,然后作为标记获得含有目的基因的细胞。DHFR时目前应用得比较广泛的选择性标记基因。DHFR的作用指催化二氢叶酸还原成四氢叶酸。当叶酸的类似物氨基喋呤和氨甲喋呤(methotrexate,MTX)存在时,可与叶酸竞争结合DHFR并抑制DHFR的活性,使细胞死亡。当细胞中DHFR基因大量扩增,并有高表达时,MTX不足以竞争结合全部的DHFR,使细胞在含有MTX的培养基中可存活。利用这一特点,和外源基因共同扩增的DHFR基因可利用它对MTX的抗性,筛选出含目的基因的细胞。
一般选用DHFR基因缺陷的CHO细胞,便于筛选目的基因。CHO细胞适用于多种蛋白质的分泌表达和胞内表达;有对培养基的适应性强的特点;可进行大量的培养,大规模生产。
外源基因的转染方法可选用磷酸钙共沉淀方法、聚乙二醇介导的细胞融合法以及电穿孔导入法等。要想得到长久稳定表达的细胞系,必须对转入的目的基因及可扩增的选择性标记基因通过增加选择物的浓度(DHFR基因通过增加MTX浓度),使外源基因进行扩增,并稳定地整合入宿主细胞的染色体上。当细胞在没有选择物的情况下,得到扩增的基因可以稳定存在下去。
三、表达产物的分离、纯化与鉴定
(一)大肠杆菌重组表达蛋白的分离、纯化
大肠杆菌的分泌型蛋白和融合型蛋白的纯化有所不同,分泌型表达蛋白的纯化必须通过细胞的溶解、包涵体的分离、变性和折叠复性等步骤;而融合型表达蛋白除了以上个步骤外,由于是融合蛋白,所以必须在包涵体分离、变性以后在进行定点裂解以释放重组的多肽并折叠复性。
1.大肠杆菌重组表达蛋白质分离的粗制品
一般步骤包括:离心收集菌体→ 超声波破碎→离心收集上清 →热处理变性→离心→上清用硫酸铵沉淀。
大肠杆菌经过离心浓缩以后可用机械磨碎法、超声波处理法或溶菌酶加去污剂法将包涵体分离。在大肠杆菌表达产率过高,超出大肠杆菌的代谢水平时,表达产物累积起来,高浓度导致形成多聚体,然后形成包涵体。包涵体的形成和溶液pH值和蛋白质本身的溶解度有关;和蛋白质之间的离子键、疏水键或共价键等化学作用有关;和高温培养条件有关。包涵体是蛋白质的聚合体,包含了表达的目的基因产物、大肠杆菌菌体蛋白成分、质粒编码的蛋白、其他污染成分。溶解包涵体常用的变性剂有尿素、盐酸胍、SDS等。一般的情况以超声波处理方法为主。
对于融合蛋白来说,除了对包涵体的处理以外,还必须使其重组蛋白从中释放。由于融合蛋白通常可以得到高效表达,且比较稳定,融合蛋白比多数菌体蛋白大,因此电泳中易于鉴定。尽管融合蛋白可大量产生,又易于纯化,但在分离纯化过程中必须进行定点裂解,以获得感兴趣的重组蛋白。定点裂解可用溴化氢裂解或蛋白酶水解方法。
重组蛋白的从包涵体中释放是缺乏生物学活性的;一系列的纯化过程中,处理的条件比较剧烈,使蛋白质高级结构破坏,因此重组蛋白的复性特别重要。蛋白质复性的原则是恢复其高级结构,并使之稳定,一般低浓度的尿素(3mol/L尿素),可使变形的蛋白质重新折叠。复性前提是蛋白质必须达到一定的纯度,另外还与蛋白质的浓度、温度、pH值及氧化还原剂条件等密切相关。
2.大肠杆菌重组表达蛋白质分离的精制品
大肠杆菌重组表达蛋白质分离的粗制品要经过凝胶层析、离子交换层析的纯化,获得相对的纯品,获得的纯品然后还需经过活性、纯度、和序列的测定加以确定。
(二)酵母重组表达蛋白的分离、纯化
酵母重组表达蛋白的分离、纯化分为两种情况:酵母细胞内表达的蛋白质和蛋白分泌型:
1.酵母细胞内表达的重组蛋白质的分离纯化
酵母细胞内表达的重组蛋白质的分离纯化的过程比较简单,以α-蛋白酶抑制剂的纯化为例:收集酵母细胞→用玻璃珠破碎 →离心取上清→DEAE Sepharose层析柱→用0-0.3mol/L NaCl梯度洗脱→收集活性部分,浓缩→SephadexG75层析→收集活性部分,浓缩→SDS-PAGE纯度鉴定达95%以上。
2.酵母表达分泌型重组蛋白的分离纯化
以酵母表达干扰素纯化为例:
发酵液用0.45μm孔径的Milipore滤膜过滤浓缩→DEAE-Trisacryl
层析柱→用0-0.3mol/L NaCl梯度洗脱→收集干扰素部分→SephadexG75凝胶过滤→用50mmol/Limidazole,pH6.8洗脱 → 收集干扰素 →用水稀释1倍→层析聚焦(Pharmacia,PBE94)缓冲液洗脱→干扰素电泳鉴定,纯度大于95%,N-末端序列正确,二硫键结构和天然一致,总回收率为13%。
提高酵母表达系统重组蛋白的产量的方法是解聚技术:把聚合体变为单体的技术,相当于大肠杆菌的包涵体处理技术。聚合体在变性的条件下(4mmol/L尿素处理),凝胶过滤可得到较好的层析峰。SDS、加热也不失为一种解聚的方法。
(三)CHO细胞的表达重组蛋白的纯化、鉴定
CHO细胞收集、离心→取上清,加EDTA,贮存与-20℃→离子交换层析(S-Sepherose)→收集洗脱NT-3→洗脱液用超滤方法浓缩→凝胶过滤(Sephacryl S-100HR)→收集层析峰(含NT-3部分),并进行浓缩 →上反相HPLC层析柱(C18)→SDS-PAGE纯度鉴定→HPLC层析峰中含NT-3部分进行序列分析。
(四)重组蛋白质分析鉴定基本要求
重组蛋白质的鉴定方法一般可以通用,但要根据不同的蛋白质选用其中部分进行运用:
重组蛋白质的鉴定方法及标准
检查内容
分析方法
鉴定标准
分子量
等电点
纯度
SDS—-PAGE
等电点聚焦电泳
HPLC
Western Blot
电泳银染色一条带,符合设计要求的指标
电泳银染色一条带,扫描95%以上
层析一个峰(95%以上)
有一条活性蛋白带
结构分析
氨基酸组成分析
氨基酸序列分析
肽谱图
各种氨基酸组分比例符合预计标准
N-末端15个氨基酸符合要求
符合定点降解
生物学活性
细胞学实验
动物实验
符合国际规定的比活性和特定生物学检测指标