作为世界上最具权威性的人类疾病相关的基因目录第五十个生日时,它面临着令人不安的变化。在接下来的几年里,美国国家人类基因组研究所(NHGRI)预计退出作为基因组数据库的始祖——称为在线人类孟德尔遗传(OMIM)唯一的资助者。谁将继承标签尚未明确。当美国国家卫生研究院(NIH)评估其数据资源时,其他NHGRI支持下更新一些的数据库都面临着类似的威胁。
伯克利加利福尼亚大学遗传学家,美国遗传学会主席Jasper Rine说:“用户关注这些免费使用的资源,包括从酵母基因组到蛋白质的一切,都是作为遗传学家和生物医学研究者日常生活的关键。”约翰霍普金斯大学监督OMIM的Ada Hamosh补充说:“如果NIH要开发新的融资模式,他们需要确保他们不会损害存在的完整性,大量使用的资源。”
NHGRI的负责人 Eric Green说,尚未做出任何决定,传闻他所计划撤出其所有的资金都是不正确的。但他和其他美国国立卫生研究院的领导人正在寻找使数据<库更有效的方式,并敦促数据库考虑付费使用。
生物学数据库长期以来一直存在资金困境。科学机构经常抱怨数据库支持占用他们的研究资金中太多资源。Philip Bourne,NIH的第一副科学数据主任,估计50大NIH支持的资源(不算GenBank和美国国家医学图书馆NLM等数据库)——在NIH每年300亿美元的年度预算中需要1亿1000万美元。数据的爆炸使它们运营更昂贵。“有一个可持续性的问题。我们需要做些什么,” Bourne说。
除了OMIM,NHGRI支持模式生物的五个数据库和其他如UniProt,它拥有蛋白质功能的数据。所有的分子数据都标注着上传人从文献中收集的信息。都是一个个宝库。OMIM,始于50年前作为一个纸质资源,1995搬到网上,吸引了一年超过2300万的页面浏览量。医生用它来罕见疾病的诊断,而基础研究人员依靠OMIM和模式生物数据库搜索基因及其蛋白产物的参考。
前一个五月,Green召集被称为这些数据库的负责人告诉他们,到2020他们需要找到新的资金选择。他说,在许多研究机构授权使用NHGRI数据库,现在NHGRI提供近3000万美元的一年的钱不够的数据库从基因组扩展到生物学数据。Green说。“我们需要考虑新的方法来经营。”
Boune的办公室的计划在NIH数据的使用来编制数据库,不过他指出,这无法成为衡量价值的唯一尺度:“你可以有一个相对小的数量的用户,但这些用户是至关重要的。”他和Green想知道是否有一些数据库可以组合以降低成本。进一步的自动化管理也许可以帮忙。但是人类仍然需要阅读论文并导出数据,部分是因为格式和术语有所不同。
将部分数据转移到其他机构可以削减NHGRI的成本。并可以采用订阅模式。拟南芥信息资源(TAIR),在植物科学研究中的模式生物的核心数据库,美国国家科学基金会资助的撤资后,2013年开始收费。“我们反对非常强烈,“加利福尼亚旧金山TAIR的负责人Eva Huala说,“但最终我们转变了。”
TAIR根据个人、机构和公司使用的数据库的多少给出价格。“这是为了确保那些最受益于资源也最有贡献的一个好方法。”Huala说。作为奖励,她补充说,因为TAIR不依赖联邦政府拨款,它已不用于取悦于审稿人而可以专注于用户想要什么,主要是最新数据。
然而,这一转变需要一些重大的改变。Huala和她的工作人员离开卡耐基科学学会(曾主持TAIR)。开始创建一个非营利组织——Phoenix 生物资讯来运营它。他们还必须建立会计和业务系统。
NHGRI资助的几个数据库对这个模式是担忧的。小鼠基因组数据库的首席研究员, Jackson实验室的 Janan Eppig说:“这是有很多不实际的原因的”。一个问题是,付费可以防止人员从链接到其他数据库的基因数据。研究人员需要用他们的研究经费来订阅。Monte Westerfield在俄勒冈大学,斑马鱼模式生物数据库负责人说:“不管怎样最终还是NIH付账”。
Bourne说NIH委员会希望今年晚些时候开始考虑新的资助计划。直到NIH为美国国家医学图书馆NLM雇佣新的负责人来安置这些的焦头烂额的数据库,这些数据库的命运可能仍不清楚。