发布时间:2024-04-18 09:44

日媒文章 全球AI蛋白质设计竞赛白热化

  参考消息网4月17日报道 日本《每日新闻》3月22日刊登题为《AI助力蛋白质设计 科研竞争进入“战国时代”》的文章,作者是松本光树,内容编译如下:

 

  人工智能(AI)的应用正在科研领域迅速普及,其中最热门的就是利用AI“设计蛋白质”。就像对话型AI能够写出流畅的文章一样,据说,AI已经能够为人类设计出有用的蛋白质。由AI参与蛋白质设计的科研竞争已经进入所谓的“战国时代”,本文将深入科研一线一探究竟。

 

  “设计一种能够用于治疗肺癌药物的蛋白质”,如果你向计算机下达这样的指令,它将反馈给你若干候选蛋白质的设计图。按照北里大学未来工学部特聘教授、产业技术综合研究所首席研究员斋藤裕所说,虽然还存在准确性的问题,但的确已经到了能够做到这一阶段的地步。

 

  2022年底,美国开放人工智能研究中心发布聊天机器人ChatGPT,生成式AI技术瞬间席卷全球。作为利用该技术进行研发的主攻方向,蛋白质备受关注。

 

  蛋白质是构成人体的分子,在人体内以将某种物质有效转化为另一种物质的酶或排除病原体的抗体等形式存在。

 

  说起来多少有些意外,蛋白质和语言有共同点。就语言来说,可以通过单词、字母的组合产生无数有意义的文章。

 

  蛋白质则是由20种氨基酸相互连接形成的链式结构。氨基酸排列组合不同,将会导致蛋白质三维结构发生巨大变化。当蛋白质结构变化时,其功能也将彻底改变。斋藤教授认为:“如果用氨基酸替换字母和单词,用蛋白质替换文章,那么AI就能以处理语言的方式处理它们。”

 

  要想制造拥有新功能的蛋白质,通常需要花费大量时间和金钱。仅仅是将20种氨基酸每20个一列排列组合,得到的模型数量就高达20的20次方之多,简直犹如宇宙中的星辰。有些蛋白质由多达300个氨基酸构成,一个一个去分析根本不现实。

 

  所以,一直以来,研究人员都是基于已有的蛋白质序列预测,再合成新的蛋白质序列。能否达到预想效果需要反复验证,从而找到最接近目标的蛋白质。

 

  但是,AI能够从无数候选者中找到那些最有可能的排序,大大降低了时间和资金成本。

 

  2018年,斋藤与东北大学教授梅津光央等人改变了发绿光的蛋白质GFP的氨基酸排序,成功制造出发黄光的蛋白质YFP。

 

  研究团队首先随机改变了GFP的排序,让AI学习蛋白质的功能如何变化。接下来,再让AI预测发黄光的蛋白质的氨基酸排序,得到AI提供的多个提案。2021年,该团队又利用同样的方法发现了一种酶,它可以促进连接氨基酸的化学反应,效率是传统酶的5倍。

 

  斋藤教授预测:“蛋白质设计这一领域将在数年内发生巨大变化。”

 

  民营企业对此的关注度也在上升,梅津教授等人在2021年创立的东北大学风险投资企业Revolka就是其中之一。

 

  该公司独立研发的使用AI设计蛋白质的技术aiProtein融入蛋白质“进化”。对生命体至关重要的蛋白质代代相传,在生物进化的同时发生细微的排序变化。由于这种排序的细微差别,即便功能仍然相同,但在有些情况下效率会有所不同。按照梅津教授的解说,通过将这种进化分子工程学的理论与AI相结合,“只要确认100个候选蛋白质的功能,就能从10万个中找到最好的那一个”。

 

  Revolka目前正在与国内的制药企业和化工企业合作,致力于独立研发生物医药产品。社长浜松典郎强调说:“有可能产生人类大脑想不到的结构和自然界中不存在的高性能蛋白质。”

 

  在斋藤教授看来,全球蛋白质设计领域已经进入“战国时代”。

 

  美国IT巨头Meta(元宇宙平台公司)和半导体巨头英伟达都在研发通过学习大量数据设计蛋白质的模型。随着数据量增长,该领域也可能出现性能爆炸性提升的“爆款”,就像之前的对话型AI一样。包含最新研究成果的论文每天都在出现,“很难说未来几个月会是什么情况”。

 

  浜松社长表示:“最近三四年,海外的研究非常活跃。如今新一波浪潮已经掀起,日本企业也必须迎头赶上。”