人类基因研究再突破
这是“人类基因组计划”之后国际科学界在基因研究领域取得的又一重大进展。人类基因组计划让我们得到了人类基因组图谱,但其中许多基因过去都不知道有什么功能。研究者最常关注的是与编码蛋白质相关的基因,但它们只占整个基因组的约2%。一个聚集了422位科学家的国际团队,完成了解析基因组剩余部分(非编码区域)的工作,人类基因组中约80%的基因都有某种确定的功能。
参与这项计划的英国桑格研究所研究人员珍妮弗·哈罗说,如果说人类基因组计划提供了一张地图,那么ENCODE计划就在这张地图上标出了各个基因的功能信息。
这两个计划之间也有承上启下的关系,在人类基因组计划基本完成的2003年,国际科学界创建了ENCODE计划。这也是一个大型国际合作项目,来自美国、英国、西班牙、日本和新加坡五国32个研究机构的科学家参与了此次项目,耗资1.5亿美元。他们获得并分析了超过15万亿字节的原始数据,目前已经全部公布。研究对147个组织类型进行了分析,以确定哪些能打开和关闭特定的基因,以及不同类型细胞之间的“开关”存在什么差异。
中科院北京基因组研究所副研究员严江伟认为,如果说人类基因组序列只是确定了字典里的字,现在ENCODE计划等于为这些字加了注释。“比如说研究先天性心脏病就可以去查心脏方面的基因。但目前人类基因功能的研究成果还是基础研究,离应用研究还有一段距离。”
“垃圾DNA”并非垃圾
基因是遗传的基本单位,到上世纪60年代,科学家认为基因是用以制造蛋白的DNA编码。人类基因组中2.1万个蛋白质编码基因只占了整个基因组的1.2%,那么,其余98.8%的基因是做什么的?1972年,日本遗传学家大野乾给这些不能编码蛋白质的DNA片段起了个名字,叫做“垃圾DNA”。
ENCODE项目的一个主要目的就是去分析那些“垃圾”的功能。经过ENCODE合作项目的初步努力,现在科学家们可以说“80%的基因组是有功能的”。
其余的20%也不是垃圾,该项目的首席分析员伊万·伯尼解释说,虽然ENCODE只分析了147种不同类型的细胞,但总数上千。如果还检测其他类型的细胞,功能可能会出现比例分化。“这就像是从80%到100%,”伊万·伯尼说,“我们真的没有任何多余的大区域DNA。这个‘垃圾’的比喻没有多大用处。”
开关调控基因活性
人类基因组中的“垃圾DNA”实际上是一个庞大的控制面板,能调控数以百万计基因的活性。如果没有这些开关调控,基因将不能正常工作,而这些区域也许会导致人类患上疾病。
从遗传学角度来看,同卵双生的孪生子具有完全相同的基因组。但是双胞胎即使在同样的生活环境下也会表现不同的性格,这是因为基因活性是不同的,同样的基因,有些基因活性大,有些活性小。
比如一种叫柳穿鱼的花卉,大多是对称的白色花瓣,有一些却长成黄色五角星。这两种花是同一种植物,样子不同并不是因为它们的基因有差异,而是因为DNA甲基化模式让一些基因“闭嘴”,这个基因活跃的时候花就是左右对称的,如果它沉默,花朵就变成轴对称。
这样的例子在植物中很多,在动物中也被发现不少,甚至可以帮助了解癌症起源。长久以来,人们了解到,当DNA发生变异时细胞很容易发生癌变。最近的一些研究表明,当表观遗传标记被干扰时,细胞也会更容易发生癌变,因为那些至关重要的基因被关闭了,而那些应当被关闭的基因却被打开了。
正如同人类基因组计划带给生物医学研究领域的革新意义,ENCODE项目也将推动生物医学的前进,开辟研究新道路。这份基因组功能图谱,其中包含有400万基因的“开关”,这一重要的参考数据将有助于研究人员找到与人类疾病密切相关的区域。
专家访谈
人类基因“天书”有了注解
——专访中科院北京基因组研究所曾长青研究员
记者:ENCODE计划的成果对人类有何意义?
曾长青:意义非常重大。完成了人类基因组计划和国际单体型图计划,相当于让我们知道了我们的基因组的DNA排序与个体之间的差异。而ENCODE计划则是分析在DNA序列上的各种功能信息,例如了解除了编码蛋白的序列之外,在基因上或基因周边还有哪些序列促进或抑制一个基因的表达,以及这些功能元件各自以什么样的方式发挥作用。这相对于在全基因组范围内,即在人类基因组这本天书上,加上了对于重要字词、句式的注解,使我们能够解读天书中这些字句的含义。
记者:了解基因的功能有什么作用?对人类治疗某些疾病有帮助吗?
曾长青:ENCODE对于DNA上调控基因表达的体系做了详细和深入的解析,这些知识结合其它研究所获得的大量疾病相关基因,就可能帮助科学家针对这些基因的关键元件设计药物靶点,或者针对不同个体易感基因上功能元件的多态性设计个体化治疗方案,达到有的放矢的治疗目的。另外,很多基因产物,例如多种有分解作用的酶蛋白参加药物的代谢,了解了这些基因的功能元件,就可以根据这些元件上的遗传多样性检测不同个体对于药物的反应和代谢能力,从而设计个体特异的用药方案,使药物治疗更加合理和准确有效。
记者:我国人类基因组学研究有哪些进展?
曾长青:我国虽然没有直接参加ENCODE计划,但像全球其他研究人员一样,很多中国学者也在进行类似的探索。只是大家多是针对某一类型的功能元件或是某一区域的元件进行的研究,而ENCODE的研究则非常全面和系统,在整个基因组范围研究所有功能元件的类型、特点与机制。所有这些工作同ENCODE计划的结果都对于彻底读懂、读通人类基因组这本天书有重要意义。此外,我国参加贡献了1%和10%的人类基因组计划和国际单体型图计划,这两个计划所获得的对于基因组序列和多态性的信息正是ENCODE得以开展的基础。
链接:人类基因组计划
人类基因组计划是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。基因组计划是人类为了探索自身的奥秘所迈出的重要一步,是继曼哈顿计划和阿波罗登月计划之后,人类科学史上的又一个伟大工程。2000年人类基因组工作草图的发表被认为是人类基因组计划成功的里程碑。1999年9月,中国正式加入国际人类基因组计划,并承担该染色体区域,即占全部工程1%的测序工作,并于2000年4月完成了人第3号染色体上3000万个碱基对的工作草图。