提速1200倍!MIT开发新一代药物研发AI,吊打老模型

简介: 提速1200倍!MIT开发新一代药物研发AI,吊打老模型
【新智元导读】MIT研究人员开发了一个几何深度学习模型。该模型在成功将类药物分子与蛋白质结合方面,比最快的计算分子对接模型更快、更准确,减少了药物试验失败的机会和成本。


众所周知,整个宇宙充满着无数分子。

 

这些分子中又有多少具有潜在的类似药物的特性,可用于开发挽救生命的药物呢?是百万级?还是十亿级?又或是万亿级?

 

答案是:10的60次幂。

 

如此巨大的数字,大大延缓了新药的研发进度,像新冠等快速传播的疾病,目前迟迟未有特效药,也是因为分子种类和数量太大,远远超出了现有药物设计模型可以计算的范围。

 

MIT的一个研究团队偏不信这个邪。算不过来是吧,那把之前的模型加加速总可以吧?

 

这一加速,就是1200倍。

 

他们研究了一款名为「EquiBind」的几何深度学习模型,该模型比之前最快的计算分子对接模型「QuickVina2-W」快了1200倍, 成功地将类药物分子与蛋白质结合,减少了药物试验失败的机会和成本。

 

研究论文即将发表在ICML 2022上。

 

 

初识「EquiBind」


「EquiBind」是基于其前身「EquiDock」研发的,「EquiDock」使用了已故的麻省理工学院AI研究员Octavian-Eugen Ganea开发的技术,去结合两种蛋白质。Ganea也是「EquiBind」论文的合著者。

 

在药物开发开始之前,研究人员必须找到有前途的药物样分子,这些分子可以在药物发现的过程中正确地结合或「停靠」在特定的蛋白质靶点上。

 

在与蛋白质成功对接后,结合药物(配体),可以阻止蛋白质发挥作用。如果这种情况发生在细菌的一种基本蛋白质上,它可以杀死细菌,从而保护人体。

 

然而,不论是从经济角度分析,还是从计算角度分析,药物发现的过程都可能是昂贵的,研发过程动辄耗资数十亿美元,并且在FDA最终批准之前,会进行超过十年的开发和测试。

 

更重要的是,90%的药物在人体试验后由于没有效果或副作用过多而失败。

 

所以制药公司收回这些成本的方法之一就是,提高最终成功研发药物的价格。

 

 

走进「EquiBind」


目前,寻找有希望的候选药物分子的计算过程是这样的:大多数最先进的计算模型依赖于大量的候选样本,再加上评分、排名和微调等方法,以获得配体和蛋白质之间的最佳「匹配」。

 

Hannes Stärk是MIT电子工程与计算机科学系的一年级研究生,也是这篇论文的主要作者,他把典型的「配体-蛋白质」结合方法比作「试图把钥匙放进有很多钥匙孔的锁中」。

 

 

 

典型的模型在选择最佳模型之前会花费时间对每个「拟合度」进行评分。相比之下,「EquiBind」无需事先了解蛋白质的目标口袋,只需一步就能直接预测出精确的关键位置,这被称为「盲对接」。

 

与大多数需要多次尝试才能找到配体在蛋白质中的有利位置的模型不同,「EquiBind」已经具有内置的几何推理功能,可帮助模型学习分子的潜在物理特性,并成功地进行归纳。以便在遇到新的或者无法识别的数据时成功泛化,以做出更好的预测。

 

EquiBind模型架构

 

这些发现的发布迅速引起了业内专业人士的注意,其中包括Relay Therapeutics首席数据官Pat Walters。

 

Walters建议,研究小组可以在一种现有的用于肺癌、白血病和胃肠道肿瘤的药物和蛋白质上去尝试他们的模型。尽管大多数传统的对接方法都未能成功地结合这些蛋白质上的配体,但是「EquiBind」成功了。

 

Walters说:「EquiBind为对接问题提供了一种独特的解决方案,它结合了姿态预测和结合位点识别。」

 

「并且这种方法利用了来自数千个公开的晶体结构的信息,有可能会以新的方式影响该领域。”

 

Stärk表示:「当其他所有方法都完全错误或仅有一个正确时,我们很惊讶,因为EquiBind能够把它放进正确的口袋,看到这个结果,我们是十分激动的!」

 

 

EquiBind解决的结构药物结合问题概览

 

助力「EquiBind」


尽管「EquiBind」已经收到了大量的来自业内专业人士的反馈,并且这些反馈帮助了团队考虑计算模型的实际用途,但Stärk仍希望在7月份即将举行的ICML上找到不同的观点。

 

Stärk表示:「我最期待的反馈是关于如何进一步改进该模型的建议。」

 

「我想和这些研究人员讨论,告诉他们我认为下一步可以怎么做,并鼓励他们继续前进,将模型用于他们自己的论文和方法中。目前已经有很多研究人员联系了我们,询问我们这个模型是否会对他们的问题有用。」

 

此外,这篇文章同样也是为了纪念Octavian-Eugen Gane,他为几何机器学习研究做出了至关重要的贡献,并慷慨地指导了许多学生,他是一个有着谦逊灵魂的杰出学者。

 

今年上半年,他在一次徒步旅行中永远离开了我们。

 


参考资料:

https://news.mit.edu/2022/ai-model-finds-potentially-life-saving-drug-molecules-thousand-times-faster-0712

https://arxiv.org/pdf/2202.05146.pdf


相关文章
|
2月前
|
人工智能 安全 API
20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
本次赛事共设三大赛题方向,参赛者可以任选一个方向参赛。本文是对每个赛题方向的参赛指南。
335 26
|
2月前
|
人工智能 运维 安全
加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时
在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。
|
2月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
4008 58
|
人工智能 自然语言处理 前端开发
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
淘宝推荐信息流业务,常年被“需求多、技术栈杂、协作慢”困扰,需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践,让部分需求两天内上线,甚至产品经理也能“自产自销”需求。短短数月,已落地 30+ 需求、自动生成 5.4 万行代码,大幅提升研发效率。接下来,我们将揭秘它是如何落地并改变协作模式的。
466 37
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
|
2月前
|
人工智能 IDE 开发工具
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
从6人日到1人日:一次AI驱动的客户端需求开发实战
|
2月前
|
人工智能 小程序 开发者
【一步步开发AI运动APP】十二、自定义扩展新运动项目03
继【一步步开发AI运动小程序】后,我们推出新系列【一步步开发AI运动APP】,助开发者打造高性能、优体验的AI运动应用。本文详解自定义扩展运动分析器的统一管理实现,提升代码复用性与可维护性,涵盖APP与小程序插件差异及完整代码示例,助力AI运动场景深度拓展。
|
2月前
|
人工智能 Cloud Native 自然语言处理
拔俗AI智能体服务开发:你的7x24小时数字员工,让企业效率飙升的秘密武器
在“人效为王”时代,企业面临服务响应慢、成本高、协同难等痛点。阿里云AI智能体以自主决策、多模态交互、持续学习三大引擎,打造永不疲倦的“数字员工”,实现7×24小时高效服务,助力企业降本增效、驱动创新增长。(238字)
|
2月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
609 41
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
471 30
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
965 49