我国首次创建并发布LncRNA疾病数据库

2013-01-23 11:58 · lobu

北京大学崔庆华副教授创建并发布了长非编码RNA疾病数据库,这是国际上第一个长非编码RNA疾病数据库,收录了160多种和长非编码RNA有关的疾病,LncRNA疾病数据库也对LncRNA与疾病之间的关系做了详细注释,这一数据库还集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。

来自北京大学的研究人员在世界上首次创建并发布了长非编码RNA疾病数据库(lncRNA and disease database, LncRNADisease),这一数据库收录了160多种和长非编码RNA有关的疾病,并集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。这一研究成果公布在Nucleic Acids Research杂志上。

长非编码RNA疾病数据库首页,点击以上图片即可进入数据库。

领导这一研究的是北京大学基础医学院医学信息学系崔庆华副教授,崔博士回国后加入北京大学基础医学院医学信息学系,在5年多的生物信息学研究工作中,他的研究涉及到了生物标记物检测、基因芯片数据分析、基因组学、蛋白质组学以及系统生物学等领域。

在2007年,崔博士研究组创建世界上第一个微小RNA疾病数据库,也是更新最频繁、数据量最大的微小RNA疾病数据库,而最新这一研究成果是在之前研究的基础上取得的。

所谓长非编码RNA疾病,是指由于长非编码RNA异常而引发的各种疾病,其实关于非编码RNA在疾病发生、发展和防治中的作用已有大量文献报导,特别是siRNA、miRNA、和RNAi已经成为现代医学生理和病生理学的研究重点,但是关于长非编码RNA与疾病发病和防治之间关联的研究,还仅仅走出了第一步。

此前一些研究表明LncRNAs及其相关结合蛋白的转录、表达、结构和调控的异常可能是肿瘤、老年痴呆、自闭症等许多重要疾病发生和发展的重要原因,还有科学家发现9p21邻近CdKn2A基因区域的LncRNA-ANRIL失调可以引起冠心病,以及LncRNA-MIAT(RNCR2)失常可引起心肌梗塞,此外研究人员还发现脑卒中时有LncRNAs的表达谱的广泛异常表达。

为了能建立已发现的上万个长非编码RNA与疾病的密切关系,崔博士等人构建了长非编码RNA疾病数据库(lncRNA and disease database, LncRNADisease),这是国际上第一个长非编码RNA疾病数据库,收录了160多种和长非编码RNA有关的疾病,LncRNADisease也对长非编码RNA与疾病之间的关系做了详细注释,这一数据库还集成了一个生物信息学工具用以预测新的人类长非编码RNA和疾病的关系。

LncRNADisease收录了有实验支持的9445条记录,包括591个微小RNA基因和396种人类疾病(2012年9月份数据),目前这一数据库拥有来自六大洲40多个国家的上千个用户,已经成为国际上研究微小RNA和人类疾病关系的重要生物信息学平台,为微小RNA和人类疾病关系研究做出了贡献。

长非编码RNA疾病数据库的创建和不断完善不仅收集和整合了lncRNA与疾病的各种数据和资料,可以进行有效查询和检索,而且所开发的生物信息学软件还可对各种已知和未知的长非编码RNA和疾病的关系进行预测和指导,它将成为研究长非编码RNA和疾病的关系一个有力的工具。

关于长非编码RNA,崔博士表示,最初人们普遍认为lncRNA仅仅是基因的“转录噪声(transcriptional noise)”,然后近年来越来越多有功能的非编码RNA被发现,当然,也有一些非编码RNA确实是转录噪声。判断一个lncRNA是否是转录噪声,一个简单的方法就是调查该lncRNA的表达谱,如果一个lncRNA没有功能,是转录噪声,那么该lncRNA的表达没有组织差异,在同一种组织的不同发育阶段也没有差异。另一个办法是调查该lncRNA序列的变异情况,如果一个lncRNA没有功能,则其核苷酸替换将没有自然选择的压力,将表现为“中性”。

崔博士还指出了当前lncRNA的研究重点主要包括:lncRNA的分类以及lncRNA的识别和鉴定,以及lncRNA和其他生物元素的相互作用的系统生物学研究,除此之外,还有lncRNA在重大疾病发生发展中的作用,lncRNA作为疾病分子标记物和药物靶点的潜力研究。

LncRNADisease: a database for long-non-coding RNA-associated diseases

Geng Chen, Ziyun Wang, Dongqing Wang, Chengxiang Qiu, Mingxi Liu, Xing Chen, Qipeng Zhang, Guiying Yan and Qinghua Cui

In this article, we describe a long-non-coding RNA (lncRNA) and disease association database (LncRNADisease), which is publicly accessible at https://cmbi.bjmu.edu.cn/lncrnadisease. In recent years, a large number of lncRNAs have been identified and increasing evidence shows that lncRNAs play critical roles in various biological processes. Therefore, the dysfunctions of lncRNAs are associated with a wide range of diseases. It thus becomes important to understand lncRNAs’ roles in diseases and to identify candidate lncRNAs for disease diagnosis, treatment and prognosis. For this purpose, a high-quality lncRNA–disease association database would be extremely beneficial. Here, we describe the LncRNADisease database that collected and curated approximately 480 entries of experimentally supported lncRNA–disease associations, including 166 diseases. LncRNADisease also curated 478 entries of lncRNA interacting partners at various molecular levels, including protein, RNA, miRNA and DNA. Moreover, we annotated lncRNA–disease associations with genomic information, sequences, references and species. We normalized the disease name and the type of lncRNA dysfunction and provided a detailed description for each entry. Finally, we developed a bioinformatic method to predict novel lncRNA–disease associations and integrated the method and the predicted associated diseases of 1564 human lncRNAs into the database.

文献链接:LncRNADisease: a database for long-non-coding RNA-associated diseases