众包科学:公民科学家助力罕见遗传病研究

2015-05-31 06:00 · 李亦奇

如果不是一位信息学家花时间不辞辛劳地搜索关于看上去并不相关话题的海量技术文献,研究人员或许永远不会去测试鱼油能缓解一种循环系统疾病——雷诺综合征的可能性。研究人员在全球约35人中诊断出这种疾病,但他们认为还有约1500人可能患有该病。

生物医学研究通常是缓慢且渐进的,但当有人发现了隐蔽的关联后,就会产生质的飞跃。例如,如果不是一位信息学家花时间不辞辛劳地搜索关于看上去并不相关话题的海量技术文献,研究人员或许永远不会去测试鱼油能缓解一种循环系统疾病——雷诺综合征的可能性。


很有可能其他颠覆性的关联游荡在生物医学文献的其他角落。不过,随着每30秒钟就有一篇新论文发表,科学家在发现这些似大海捞针般的关联时面临着巨大的压力。目前,一组研究人员正在启动一个众包项目,旨在通过利用外行志愿者在浏览文献寻找关键术语方面所作的努力,为帮助创建一个强有力的可搜索数据库打下基础。

这个众包搜索项目名为Mark2Cure,其首次面向有着特定动机的一群人,即患有一种最新发现的遗传疾病——NGLY1缺陷的人群。这种疾病由一种从蛋白中移除糖分子以确保适当降解的酶——NGLY1的缺失所致。研究人员在全球约35人中诊断出这种疾病,但他们认为还有约1500人可能患有该病。NGLY1缺陷拥有一系列扑朔迷离的症状,包括肝脏出现问题、条件反射很差、无法流眼泪,甚至有时抽搐。

2012年,外显子组测序确认了全球首位NGLY1病人、来自美国盐湖城的7岁男孩Bertrand Might。去年秋天,Bertrand的父母——Cristina Might和Matt Might通过一条会议推特了解到,斯克里普斯研究所生物信息学家Andrew Su正在寻找外行志愿者参与一个搜索项目。Su和同事此前发现,新手能可靠地开展搜索,而每条摘要会帮其赚取约7美分。在那项研究中,科研人员通过一个利用人类智力完成计算机无法做好的事情的网络平台——Mechanical Turk寻找线索。“下一步是将费用减少到零,看是否能招募到志愿者帮助我们。”Su介绍说。

Might夫妇非常渴望对此有所贡献,并且加入了NGLY1患者社群。“很明显,他们有兴趣并且愿意从不同角度解决这个问题。”Su表示。作为犹他大学的一名计算机专家,Matt Might对于管理和共享数据有着和Su一样的热情。Might夫妇还发现了以私人方式共享数据的威力。Matt关于Bertrand的4年诊断经历的文章最终在确认新的NGLY1患者方面起到了至关重要的作用。

国立卫生研究院(NIH)在雇佣专业人士做此类工作方面已花费了数百万美元。如今,斯克里普斯研究所团队计划招募有能力并且愿意免费做相同工作的非专业人员。他们可以利用自己的电脑,每次完成一小部分工作。建立知识库要求人类教会电脑识别来自被搜索文章的关键概念。同时,经过适度的在线训练,任何用英语阅读的人都能浏览研究论文寻找关键词,比如基因、蛋白、疾病和药物的名字,并且利用在线标记工具记录它们之间的关系,比如X药物能治疗Y疾病。在一项几个月前完成的试验中,斯克里普斯研究所的科研人员发现,尽管平均而言这些新手无法同拥有博士学位的人相媲美,但初学者团队实际上和专业人士不相上下,甚至比后者做得稍好。

Su 介绍说,Mark2Cure目前的项目“都在证明志愿者工作上的产出从科学的角度来说是有意义的”。为确保这些结果能被应用于针对NGLY1开展的研究,Might夫妇帮助斯克里普斯研究所团队联系上糖基化专家Hudson Freeze。Freeze在离斯克里普斯研究所仅180米的桑福德—伯纳姆医学研究所拥有一个实验室。他和同事做一些帮助确认NGLY1突变引发Bertrand所患疾病的实验。

从那以后,Freeze的实验室利用采集自10位NGLY1病人的样本建立了细胞系。他希望这个众包项目将产生可以测验的新假设。例如,搜索工作能发现一些暗示研究人员在实验室中测试以了解疾病机制的特定生物标记或资料解析的信息,或者最好找到治疗NGLY1缺陷的方法。

尽管Mark2Cure刚刚正式启动,但一小群助理人员已经浏览了100多条摘要。Mark2Cure科学推广项目经理Ginger Tsueng介绍说,为达到合适的准确度,每条摘要需要被至少15名不同的非专业助理人员作注释。该团队希望这些公民科学家最终将浏览上千篇被筛选出来的可能同NGLY1缺陷相关的文献。参与者可以根据工作表现积累分数,每条摘要最高达1000分,这取决于他们和其他参与者的标记匹配度有多好。Su说,在这个过程中没有“排行榜”或奖励。公民科学家似乎有充足的动力为此作出贡献。

Eileen Estenik是一名来自密苏里州的兼职秘书,也是志愿者之一。在2014年11月她两岁的儿子Benjamin被诊断为患有NGLY1缺陷后,她通过Might夫妇知晓了Mark2Cure项目。在此之前,这个男孩一直被当作癫痫患者治疗,并且因肝脏肿瘤接受了两轮化疗,最终在去年夏天被批准进行肝脏移植。Estenik说:“我们经历了太多事情。”她在Mark2Cure小范围测试期间便开始搜索工作,截至目前已累积了5万多分。“我们想要可爱的小男孩和他所有的伙伴能拥有我们所能给予的最好生活。”Estenik说,“如果这意味着我们不得不读完所有这些文档来帮助我们的医生,那就顺其自然吧。”

科学家还认为,Mark2Cure会取得成功。“和机器相比,现在人们能更好地在已发表论文中找到有用信息。”参与ClinGen项目的斯坦福大学生物学家Mike Cherry表示。ClinGen是NIH资助的一个搜索项目,旨在建立精准医学和研究中基因组变异的数据库。“Su已经设计了一种有趣和吸引人的方法,对文献进行分类。我确信结果将非常有趣。”

推荐阅读:

Researchers turn to volunteer readers to speed research on rare genetic disorder