专访太仓生命信息研究所执行所长朱伟民教授

2012-10-11 17:04 · buyou

太仓生命信息研究所是一个学术研究机构、非盈利性的事业单位,由太仓政府提供启动资金,由芝加哥大学教授蓝田和生物信息资深专家朱伟民负责运行操作,由科学顾问团(SAB)指导研究所的运行与发展方向,SAB由生物信息学的先驱、顶级的业内科学家以及中国科学院、中国工程院院士组成。

太仓生命信息研究所是一个学术研究机构、非盈利性的事业单位,由太仓政府提供启动资金,由芝加哥大学教授蓝田和生物信息资深专家朱伟民负责运行操作,由科学顾问团(SAB)指导研究所的运行与发展方向,SAB由生物信息学的先驱、顶级的业内科学家以及中国科学院、中国工程院院士组成。太仓生命信息研究所(TILSI)的网站与Bioso!搜索引擎于10月11日正式上线。借此机会,生物探索专访了太仓生命信息研究所执行所长、生物信息学资深专家朱伟民教授。

2011年太仓生命信息研究所揭幕时朱伟民教授的演讲

生物探索:朱教授,我们了解您在国外从事生物信息学的工作,那国际上生物信息学中心的现状是?面临哪些挑战?

朱伟民:国际上三大生物信息学中心为:美国NCBI、英国EBI、日本DDBJ。其中DDBJ规模小,涵盖的数据类型少。这三个组织互相共享和交换数据,但也面临诸多无法解决的问题。第一是海量的数据管理问题。生物界的数据量呈指数级增长,随着科学发展,如今日趋庞大。另外,数据类型日趋复杂。如何管理这些大量的复杂的数据,是生物信息学中心面对的一个巨大挑战。例如我现在有海量的基因组数据,我如何管理?原始数据数量庞大,我不能全部保持,那么我应该保持哪些最低限度的数据?这些都是难题。第二是数据整合问题。第三是数据挖掘问题。第四是数据可视化问题。数据类型很复杂,要将它们很直观地呈现给用户,很困难。第五是用户的使用经验问题,除此之外还存在着网络上的问题。

生物探索:中国生物信息学中心的现状如何,为何会选择回国建立TILSI这样的生物信息中心平台?

朱伟民:中国已经成为或者在某一些数据类型上即将成为世界上产生数据数量最大的国家。四年前我在华盛顿开会,在会上获知,NCBI获取数据量最多、数据量最大,其中中国提交的数据量最多,超过了美国。现在中国在核酸这一数据类型上,已经成为世界上数据量最多的国家,其他数据类型的数量也即将成为世界上最多的。但是中国不得不把数据送到中国以外的数据库中,包括国际三大数据库。这是国际上制定的标准。此外,中国一定要接受国际上定的标准。

中国面临的问题是:第一,中国数据送往国际生物信息学中心之后,不能体现其来源。第二,中国数据送过去之后,在包装、体现、公布方面,中国不能在世界上产生影响。第三,中国科学家对数据的要求,在国际上处于完全隔离、忽略的状态。究其原因,是因为中国目前没有生物信息学中心,没有一个非常强的声音,能够代表中国参与国际上标准的制定,参与国际上的活动。如果这种现状不改变,这种情况将会持续。正因为中国生物界没有统一的生命信息数据中心,不能为中国科学家提供良好的服务。中国的科学家做实验或者研究时,只能到NCBI或者EBI拿取数据,但由于网络网速的限制,此过程并不总是一帆风顺。我们不能展示中国的研究对世界的贡献,更重要的是,中国永远不可能到世界上参与竞争,尽管中国已输出大量数据。这是不公平的。简单一句话总结,中国需要一个生物信息学中心,中国需要一个统一的高质量的世界水平的生命信息数据中心。这个生命信息数据中心,能够给中国的科学家提供优质的服务,能够站在世界舞台上,积极地参与国际竞争。TILSI生物信息基础平台的建设将为建立中国自主的高水平的生物信息中心奠定基础。

生物探索: 除了建立生物信息中心外,TILSI自主研发了Bioso!搜索引擎,它的亮点有哪些?用户是免费使用吗?

朱伟民:Bioso!最大的亮点在于“整合”, 我们的 summary page是数据、工具与文献资源的整合,是针对相关搜索条目的百科全书。它整合了多个数据来源,以分页的方式来展示被搜索条目多维的生物医学特性。Bioso!不仅具有高级搜索的功能,在检索结果页面还添加了“filter”,方便用户进行精确查询。

Bioso!背后的综合性服务平台整合了数据,工具和文献资源。此次上线,该平台收集了使用最为广泛的4种数据类型,6个数据库——基因组(Ensembl & Ensembl Genomes),核酸(EMBL-Bank & EMBL-CDS),蛋白质(Uniprot & InterPro),相互作用(IntAct);与2个分析工具——Blast & AmiGo。接下来会有更多的生物信息资源逐步整合到该平台,计划明年年底有几十个数据库整合到该平台。生物信息平台的资源完全免费,用户无需注册即可使用。

生物探索:像TILSI这样的生物信息中心建立以及Bioso!搜索引擎的开发,对中国的生命科学领域发展会有哪些促进作用?

朱伟民:TILSI这生物信息中心的建立以及Bioso!搜索引擎的开发,它宣告了中国自主研制的搜索引擎在生命科学领域的诞生,同时也显示了TILSI服务于科学的承诺与我们对生物信息学平台建设工程化的追求。这是TILSI的第一个重要里程碑,为实现我们长远的目标走出了第一步。

对于中国的生命科学领域的发展我觉得有几个方面的作用:首先,它为生命科学研究提供支持和引导。研究人员可以在海量的数据库找到想要的东西,并且在搜索的同时有新的发现。其次,它为中国生物信息学资源的获取,管理,整合以及知识挖掘提供了一个综合的平台,为支持国家重大科学项目海量数据的分析与注释提供了一个技术框架。