一周内第二篇Nature:AlphaFold震撼揭示98.5%人类蛋白质结构

2021-07-23 13:43 · angus

AlphaFold已经实现对98.5%已知人类蛋白质以及大肠杆菌、果蝇、斑马鱼等20种模式生物蛋白质的结构预测。

“毫无疑问,这是迄今为止人工智能系统为提升科学知识所做出的最大贡献。”

“这完全是一场变革。了解如此规模的蛋白质结构将让结构生物学家洞察其机能。”

当地时间7月22日,顶级期刊《Nature》带来了一项令科学家们振臂高呼的文章。DeepMind公司宣布旗下人工智能系统AlphaFold已经实现对98.5%已知人类蛋白质以及大肠杆菌、果蝇、斑马鱼等20种模式生物蛋白质结构预测。更惊人的是,该系统还能够对其预测结果的置信度进行测量。也就是说,生物学家们盼了数十年,终于盼来了一个“给力”的科研“外挂”。


https://doi.org/10.1038/s41586-021-03828-1

蛋白质是构成生命体的重要物质,其结构能够为科学研究提供诸多宝贵信息。包括对生物过程的推理,以及帮助科学家们基于相关结构进行药物开发。经过数十年的漫长努力,结构生物学家已经确定了覆盖人类蛋白质组17%的氨基酸。如何更快更好地解开更多蛋白质结构,仍然是生物学界的一大挑战。


图片源自Yuan He

一周前,DeepMind公司在《Nature》分享了其备受关注的AlphaFold2的源代码,这款人工智能系统曾在2020年的国际蛋白质结构预测竞赛(CASP)上击败了约100个团队,对三分之二的蛋白靶点给出几乎与实验室解析相等的结构预测结果。尽管此篇研究文章的发布已经令人大饱眼福,但是科学家们仍然期待着AlphaFold2能够为科学界带来更多惊喜。

如今,第二篇《Nature》的发布又一次在科学界又投下了一颗重磅炸弹。DeepMind公司带来了36.5万个蛋白质结构,并且这些结构信息可在欧洲分子生物学实验室下属欧洲生物信息学研究所EMBL-EBI 核酸数据库中免费获得。预计随着新蛋白质的识别和预测的改进,到今年年底数据将增至1.3亿

如此规模的蛋白质结构已经令人足够振奋,但是在这篇最新的文章中,AlphaFold还将为科学家们带来了另一个惊喜:对预测蛋白质置信度的估算。


图片源自Nature

“我们希望能够给科研人员和生物学家一个非常明确的信号,告诉他们应该依赖预测的哪些部分。”该报告的第一作者、DeepMind的科学工程师Kathryn Tunyasuvunakool说,“在当前近乎覆盖整个人类蛋白质组的蛋白质结构中,AlphaFold2对58%的氨基酸残基预测具有置信度,其中有36%的预测结构具有非常高的置信度,能够提供对药物设计有用的详细的原子特征,例如酶的活性位点。”

当然,即使是不太准确的预测结构也可能会启发生物学研究。生物学家们通常认为,人类和其他真核生物蛋白质中有一定比例没有固有的结构,只有在与其他分子协同作用的情况下才具有特定的结构。而AlphaFold2预测不准确的蛋白质,或许就是这类无序物质。

该报告的合著者、EMBL欧洲生物信息研究所所长Ewan Birney说:“这将是人类基因组图谱绘制以来最重要的数据集之一。AlphaFold2已经刺激了新型酶的发展,并为药物治疗被忽视的疾病带来了新的可能性。”

总之,DeepMind公司的成果正将结构生物学带入新的想象之中,这可能意味着生物学研究的“范式转变”。期待今后人工智能系统能够为生物学研究带来更多惊喜。

参考资料:

[1]https://www.nature.com/articles/s41586-021-03828-1

[2]https://www.nature.com/articles/d41586-021-02025-4

[3]https://www.sciencemag.org/news/2021/07/new-public-database-ai-predicted-protein-structures-could-transform-biology

关键词: AlphaFold DeepMind