谷歌提前开源AlphaFold 2!Nature、Science同时公开两大蛋白质结构预测工具(二)

简介: 昨日,DeepMind和华盛顿大学分别在nature和Science两大顶级杂志发布了各自预测蛋白质结构的工具,并同时开源了代码。

 DeepMind表示,AlphaFold 2可以对蛋白质的基本物理结构进行十分准确的预测,并能够在几天内生成高精度的结构。 此外,模型还能利用内部的内部置信度来预测每个预测的蛋白质结构中哪些部分是可靠的。 训练数据来自大约17万个蛋白质结构,以及包含未知结构的蛋白质序列的大型数据库。 期间DeepMind使用了16个TPU进行训练(即128个TPUv3核心或大致相当于约100-200个GPU)。 

39.jpg

神经网络模型结构 其中,模型对蛋白质序列以及氨基酸残基对进行操作,在两种表征之间迭代传递信息以生成结构。 

image.jpeg

                                          AlphaFold生成的蛋白质高精度结构 

image.jpeg


                                  架构细节


RoseTTAFold:媲美AlphaFold 2的预测工具


无独有偶,隔壁Science杂志也刊登了另一个蛋白质结构预测的工具,名叫「RoseTTAFold」,特点是「快、准、狠」。 2020年,DeepMind在CASP 14大会上介绍了它在该蛋白质结构预测上的显著进展。 华盛顿大学医学院蛋白质设计研究所的研究人员看在眼里,受其启发,与哈佛、剑桥、德克萨斯大学西南医学中心、劳伦斯伯克利国家实验室联手,共同研发了一款基于深度学习的蛋白质结构预测工RoseTTAFold。 这款工具利用深度学习,仅凭有限的信息,就能在普通游戏本上快速而准确地预测蛋白质结构,在短时间就能构建出复杂的生物组建模型。 目前,该研究团队已经用RoseTTAFold计算出了数百种新的蛋白质结构,其中就包括了许多鲜为人知的人类基因组蛋白。 RoseTTAFold预测出了与脂质代谢问题、炎症紊乱和癌细胞生长相关的蛋白质结构。 RoseTTAFold是一个「三轨」神经网络("three-track" neural network),它能够兼顾蛋白质序列模式、氨基酸如何相互作用以及蛋白质三维结构的可能性。 在这个架构中,信息在一维(氨基酸序列)、二维(距离)和三维(坐标)之间来回流动,从而能够集中推理出蛋白质化学部分与折叠结构之间的关系。 


image.jpegRoseTTAFold 架构包含一、二、三维注意力轨道,轨道之间信息能够来回流动image.jpeg                                       在CASP14目标取得的平均TM-scoreimage.jpeg

在CAMEO实验中取得的盲基准结果 蛋白质结构预测不断取得新进展,最关键的问题莫过于:能够使用什么准确的蛋白质结构模型? 团队研究了RoseTTAFold通过X射线晶体学和低温电子显微镜,研究了促进实验结构测定实用性,为目前为之结构的关键蛋白质提供模型。 RoseTTAFold方法的准确性远高于现有方法,因此,研究人员希望能够测试出这款工具是否能够解决分子置换(MR)这一从未解决的问题。 在蛋白质数据库(PDB)中,有四种蛋白无法用MR解决:牛属甘氨酸N-酰基转移酶(GLYAT)、细菌氧化还原酶、细菌表面层蛋白(SLP)和来自真菌平革菌属金孢子菌属的分泌蛋白,因此研究人员使用RoseTTAFold重新分析蛋白质结构。 



image.jpeg

由于蛋白质结构的测定能够为生物功能和机制提供大量见解,团队也研究了RoseTTAFold是否也能有这样的功能。 研究人员主要针对两组蛋白:目前未知结构的G蛋白偶联受体;与疾病相关的人类蛋白质。 研究结果发现,即使没有已知结构的密切同源物,RoseTTAFold模型在活性和非活性状态下也能做到准确预测构型。



image.jpeg


研究人员使用RoseTTAFold工具,从序列信息中预测了大肠杆菌蛋白复合物的结构。图A中,灰色表示第一条亚基,彩色表示第二条亚基。图C是RoseTTAFold生成的IL-12R/IL-12复合结构。 论文一作Minkyung Baek希望RoseTTAFold这个新工具未来能够造福整个研究领域。



相关文章
|
前端开发 JavaScript Java
Springboot2.x+Websocket+js实现实时在线文本协同编辑,并展示协同用户
Springboot2.x+Websocket+js实现实时在线文本协同编辑,并展示协同用户
Springboot2.x+Websocket+js实现实时在线文本协同编辑,并展示协同用户
|
机器学习/深度学习 人工智能 自然语言处理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
一文搞懂【知识蒸馏】【Knowledge Distillation】算法原理
|
运维 供应链 监控
一文带你了解什么是TOGAF?及TOGAF的应用?
TOGAF(The Open Group Architecture Framework)是由The Open Group组织开发的企业架构框架,提供了一套方法论、工具和术语,帮助企业设计、规划、实施和管理企业架构。其核心是架构开发方法(ADM),涵盖从架构愿景到实施的各个阶段。TOGAF支持跨部门协作、持续改进和项目成功,适用于新系统开发、系统升级、业务流程优化和组织变革管理等场景。
3066 1
一文带你了解什么是TOGAF?及TOGAF的应用?
|
3月前
|
XML 人工智能 定位技术
如何让AI更懂你?掌握提示词与上下文工程的核心思维
本文深入解析与大型语言模型交互的核心技巧,涵盖提示词(Prompt)、提示词工程与上下文工程三大关键概念,助你从AI用户进阶为高效引导者,全面提升AI应用能力。
|
10月前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
873 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
【LaTex、markdown】常用语法写出漂亮的blog
【9月更文挑战第9天】本文介绍了使用LaTeX和Markdown编写美观博客的方法。LaTeX方面,需定义文档类型、设置标题与作者,并利用特定命令处理文本格式、列表、数学公式、图片和超链接。Markdown则通过井号表示标题级别,使用星号或下划线标记文本,简化列表和公式的编写,并以直观方式插入图片和链接。两者均可通过合理布局提升博客的可读性和视觉效果。
374 8
|
9月前
|
机器学习/深度学习 人工智能 数据挖掘
AI概率学预测足球大小球让球数据分析
在足球数据分析中,AI概率学预测主要用于大小球和让球盘口的分析。大小球预测通过历史数据、机器学习和实时数据动态调整进球数;让球分析则利用Elo评分等评估实力差距,结合盘口数据预测比赛结果。数据来源包括历史比赛、球队和球员信息及外部因素。模型选择涵盖回归、分类和时间序列模型,并通过交叉验证、误差分析进行优化。实际应用包括制定投注策略、风险管理及开发自动化系统。代码示例展示了使用随机森林回归模型预测进球数的过程。
|
12月前
|
自然语言处理 监控 搜索推荐
如何通过电商 API 接口实现智能客服与用户互动?
随着电子商务的发展,企业对客户服务的需求激增。传统人工客服在高峰期难以应对大量咨询,导致效率低下和客户满意度下降。为此,越来越多的电商企业采用智能客服系统,通过电商API接口实现高效互动。本文探讨了如何利用电商API接口构建智能客服系统,介绍其技术组成、作用及实现策略,包括多渠道接入、优化交互界面、强化自然语言处理能力、个性化服务、提升自动化水平和监控分析等。同时,也讨论了面临的挑战与解决方案,强调统一API标准、加强数据安全和持续技术投入的重要性。最终,智能客服将为企业带来更高的服务效率和用户体验。
1087 3
|
机器学习/深度学习 数据采集
开源多结构蛋白质预测大模型——Genie 2
【6月更文挑战第24天】Genie 2,一款开源的深度学习蛋白质设计模型,扩展了原始Genie的结构预测能力,通过创新架构和大规模数据增强处理更复杂多样的蛋白质结构。引入的多基序框架允许设计多功能蛋白质,提升无条件和有条件生成的性能。尽管面临数据质量、复杂相互作用处理及模型可解释性的挑战,Genie 2仍为蛋白质设计树立新标杆。[论文链接](https://arxiv.org/abs/2405.15489)
341 1
|
机器学习/深度学习 人工智能 数据可视化
斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3
【8月更文挑战第8天】AlphaFold 3作为AI领域的重大突破,革新了蛋白质结构预测。斯坦福博士通过图解详析了其内部机制,展示了多尺度建模与图神经网络技术如何提升预测精度。尽管存在数据依赖性和计算成本等挑战,AlphaFold 3仍极大地加速了生物学研究与药物开发进程。论文详情参见:https://www.nature.com/articles/s41586-024-07487-w
655 4