小鼠重编程的胚胎成纤维细胞,颜色点代表特定基因的信使RNA。红色代表Sall4基因的mRNA,绿色的是Sox2,蓝色的是Fbxo15。
几年以前,生物学家发现一般的体细胞可以被重编为多能干细胞,这是一种可以变为任何细胞类型的干细胞,在治疗很多人类疾病上具有很大的潜力。
这些诱导多能干细胞(iPSCs)一般来说是由改变了遗传物质的细胞得到的,这些细胞会过度表达四个基因,并转变成不成熟的胚胎状态。但是只有一小部分细胞可以做到这点。
现在,麻省理工学院和怀特海德研究所(Whitehead Institute)的研究人员找到了新的遗传标记,可以让整个过程变得更有效,使科学家能预测哪些处理过的细胞可以成功地转变为多能干细胞。
这篇新论文发表在9月13日的《细胞》杂志网络版上,研究人员还发现了产生诱导多能干细胞的新因子组合。
麻省理工学院的生物学教授和怀特伍德研究所的成员Rudolf Jaenisch领导了这项研究。研究首次考察了个体细胞在变成多能干细胞时发生的遗传变化。之前的研究只是观察了大量细胞的基因表达变化,但因为不是所有的细胞都被重编成干细胞,所以很难挑出参与这一过程的基因。
“在之前的研究中,你不能检测到少数几个细胞表达多能干性标记的情况。这项研究很酷,因为你能探测到两个到三个细胞在早期就表达了这些重要的基因,这是之前没有做到的。”Jaenisch实验室的研究生Dina Faddah说,她是论文的作者之一。
论文的另一个作者是Yosef Buganim,他是怀特海德的博士后。
单细胞分析
2007年,科学家发现了成体人类细胞可以通过过度表达Oct4,Sox2,c-Myc和Klf4四个基因的方法重编。但是在所有过度表达这四个基因的细胞里,只有大约0.1%到1%的细胞会变得多能。
在新的研究中,Jaenisch和他的研究团队重编了小鼠胚胎成纤维细胞,并测量了48个已知或潜在和诱导干细胞有关的基因表达。这样,他们就能比较诱导成功的多能干细胞、没有诱导成功地成体细胞,以及发生了部分重编细胞的基因表达图谱。
当重编完成以后(需要32到94天),研究人员测量了诱导多能干细胞的基因表达。
研究团队找到了4个在极早期(大约在诱导基因转入的6天后)就开始表达的基因:Esrrb,Utf1,Lin28和Dppa2,这些基因可以控制其他参与多能干性基因的转录。
研究人员还发现一些曾被认为是多能干性的标记只在部分重编的细胞中表达,说明这些标记不一定有用。根据新发现的标记,“你可以去掉细胞群落中那些没有完全重编的细胞,”Buganim说,“你不会想要部分重编的诱导干细胞来治疗病人。”
为了准确地阅读细胞的遗传图谱,研究人员使用微流体系统Fluidigm来筛选基因,他们随后用荧光摄影技术确认了结果。他们使用的荧光技术可以探测到单链信使RNA。
不完全是随机的
这项发现还让研究人员建立一个新的模型,来解释基因相互作用是如何操纵细胞变成多能干细胞的。此前,重编一直被认为是随机过程。也就是说,当四个重编基因过度表达以后,这些基因能否激活正确的基因让细胞逆转出干性是一件碰运气的事情。
但是,这相信研究显示,只有最早期的阶段才是随机。当随机因素让细胞自己的Sox2基因表达以后,Sox2就能确定地开启信号通路,让细胞变成诱导多能干细胞。
Buganim认为,在早期随机阶段,让Sox2激活的可能方法有很多。“不同的细胞可以通过不同的方法激活Sox2,”他说,“只要你有一个特定的组合可以激活Sox2,那么你就可以让细胞完全地重编。”
这项新发现预测了6个可以激活Sox2的因子组合。研究人员检验了这些组合,发现他们的预测很成功,尽管不同的组合效率不同。
“对利用单个细胞的基因表达数据来研究生物信息学和预测基因层级,调控重编过程来说,这是一次漂亮的展示,”多伦多Samuel Lunenfeld Research Institute的资深研究员Andras Nagy说,他并没有参与这项研究。
有趣的是,麻省理工学院研究团队这次发现的诱导因子组合并不包括之前的重编因子中的任何一个。研究人员正在测试新的诱导因子组合,看看能否产生更加健康的诱导干细胞。最为严格的检测方法是把诱导多能干细胞注射到有四套染色体(正常是两套)的胚胎中,这样的胚胎不含有正常的细胞。如果注射后的胚胎能发育成健康的动物,那它就是诱导多能干细胞形成的,说明诱导多能干细胞和胚胎干细胞等价。大部分注射到胚胎中的诱导多能干细胞都不能通过测试。
Single-Cell Expression Analyses during Cellular Reprogramming Reveal an Early Stochastic and a Late Hierarchic Phase
Yosef Buganim, Dina A. Faddah, Albert W. Cheng, Elena Itskovich, Styliani Markoulaki, Kibibi Ganz, Sandy L. Klemm, Alexander van Oudenaarden, Rudolf Jaenisch
During cellular reprogramming, only a small fraction of cells become induced pluripotent stem cells (iPSCs). Previous analyses of gene expression during reprogramming were based on populations of cells, impeding single-cell level identification of reprogramming events. We utilized two gene expression technologies to profile 48 genes in single cells at various stages during the reprogramming process. Analysis of early stages revealed considerable variation in gene expression between cells in contrast to late stages. Expression of Esrrb, Utf1, Lin28, and Dppa2 is a better predictor for cells to progress into iPSCs than expression of the previously suggested reprogramming markers Fbxo15, Fgf4, and Oct4. Stochastic gene expression early in reprogramming is followed by a late hierarchical phase with Sox2 being the upstream factor in a gene expression hierarchy. Finally, downstream factors derived from the late phase, which do not include Oct4, Sox2, Klf4, c-Myc, and Nanog, can activate the pluripotency circuitry.