地球超2亿蛋白质结构全预测,AlphaFold引爆「蛋白质全宇宙」!(1)

简介: 地球超2亿蛋白质结构全预测,AlphaFold引爆「蛋白质全宇宙」!

新智元新智元 2022-07-29 12:33 发表于北京



 新智元报道  

编辑:拉燕 Aeneas 如願 桃子

【新智元导读】今天,AlphaFold又让学术界沸腾了。DeepMind官宣,AlphaFold可以预测出2亿多个蛋白质结构,几乎覆盖了整个「蛋白质宇宙」。


今天,DeepMind再次引爆学术界!

AlphaFold能够预测2亿多个蛋白质结构,实现数量级的重大飞跃。


最重要的是,全部免费开放!
在未来,预测蛋白质结构就如同使用「谷歌搜索引擎」一样简单。

DeepMind的首席执行官Demis Hassabis称,

这个数据库涵盖了整个蛋白质宇宙,我们已经迈入数字生物学的全新时代!

超2亿蛋白质结构,免费用


不可小觑的是,AlphaFold确实是学术界「海啸级」的存在,足以改变全人类。


2021年,DeepMind开源AlphaFold2后,震撼发布了AlphaFold蛋白质结构数据库(AlphaFold DB) 。

当时,98.5%的人类蛋白质结构全被AlphaFold2预测出来了。

而现在,DeepMind正式宣布该数据库已经从近100万扩大到2.14亿个结构,预测蛋白质结构数量也提升了200多倍!

几乎涵盖了地球上所有已进行过基因组测序的生物体。

据介绍,在超过2亿个蛋白质结构预测中,大约35%的结构具有高精度,并且已达到了实验手段获取的结构精度。

80%的结构可靠性足以用于多项后续分析。

让人兴奋的是,所有蛋白质三维结构都可以通过谷歌云公共数据集 (Google Cloud Public Datasets) 进行批量下载。

https://github.com/deepmind/alphafold/blob/main/afdb/README.md

这次数据库的更新更是涵盖了植物、细菌、动物和其他微生物的蛋白质结构。

另外,DeepMind也将自身数据库集成到其他公共数据集,像Ensembl、UniProt 和 OpenTargets都可以使用。

目前,AlphaFold已被广泛使用,成为了世界各地成千上万实验室和大学的重要工具。

仅发布12个月后,已经有190个国家/地区的50多万研究人员访问数据库AlphaFold DB,查看了超200万个结构。

科学家用其推进现实问题的研究,诸如疟疾候选疫苗、蜜蜂健康、抗生素抗药性等等。

当前公布的这份前所未有的2亿多个蛋白质结构,将帮助我们探索生命科学的无尽奥秘。

AlphaFold的成功逆袭之路


时至今日,一提到AlphaFold,仍旧让人兴奋不已。

因为它的诞生成功破解了生物学持续50年的重大难题——蛋白质折叠问题。

还证明了AI可以在几分钟内以原子精度准确预测蛋白质的形状!

说起AlphaFold的发展历程,其实算得上有些年头了。

很多人可能都不知道,2016年可以说是DeepMind开发AlphaFold萌芽的起点。

2016:潜力无限


2016年,DeepMind的AlphaGo刷爆网络。

来自韩国的世界知名棋手李世石不敌AlphaGo,让人们见识到了AI能做什么。

人们也开始逐渐意识到,AI真的潜力无穷。除了围棋,在未来还能应用在各种各样的科学研究中。

也是从这时开始,DeepMind想尝试用AI解决蛋白质的折叠问题。

很快,AlphaGo吸粉无数的那一年3月,DeepMind组建了一队人马,开始着手研究蛋白质结构的预测问题。

2018:初次亮相


2年后,也就是2018年,生物学界的「AlphaGo」来了。

AlphaFold在国际蛋白质结构预测竞赛(CASP)上首次亮相,力压其他97个参赛者。

当时,AlphaFold预测出了43种蛋白质中25种蛋白质的最精确结构。

在同一类别中排名第二的队伍,只预测出了3种。

一时间,所有人将其为DeepMind在科学发现领域的第一个重要里程碑。


相关文章
|
SQL 人工智能 运维
一文带你玩转 CODE CHINA 的开源广场|Code China
「Code China Explore」即 CODE CHINA 开源广场,主要用于聚合平台的优质内容,包括了开源课程、项目、话题及开源组织等,可以让所有开源爱好者进行知识分享和学习。下面着重介绍 Code China Explore 上面的组织及其享受的权益、话题及项目。
1255 0
|
6月前
|
API 开发工具 Android开发
【HarmonyOS 5】鸿蒙中进度条的使用详解
【HarmonyOS 5】鸿蒙中进度条的使用详解
357 7
|
运维 安全 SDN
网络拓扑设计与优化:构建高效稳定的网络架构
【8月更文挑战第17天】网络拓扑设计与优化是一个复杂而重要的过程,需要综合考虑多方面因素。通过合理的拓扑设计,可以构建出高效稳定的网络架构,为业务的顺利开展提供坚实的支撑。同时,随着技术的不断进步和业务需求的不断变化,网络拓扑也需要不断优化和调整,以适应新的挑战和机遇。
|
Kubernetes API 数据安全/隐私保护
K8S中的ServiceAccount和useraccount并配置私有仓库用户名密码Harbor拉取私有镜像
K8S中的ServiceAccount和useraccount并配置私有仓库用户名密码Harbor拉取私有镜像
510 1
|
11月前
|
机器学习/深度学习 自然语言处理 搜索推荐
自注意力机制全解析:从原理到计算细节,一文尽览!
自注意力机制(Self-Attention)最早可追溯至20世纪70年代的神经网络研究,但直到2017年Google Brain团队提出Transformer架构后才广泛应用于深度学习。它通过计算序列内部元素间的相关性,捕捉复杂依赖关系,并支持并行化训练,显著提升了处理长文本和序列数据的能力。相比传统的RNN、LSTM和GRU,自注意力机制在自然语言处理(NLP)、计算机视觉、语音识别及推荐系统等领域展现出卓越性能。其核心步骤包括生成查询(Q)、键(K)和值(V)向量,计算缩放点积注意力得分,应用Softmax归一化,以及加权求和生成输出。自注意力机制提高了模型的表达能力,带来了更精准的服务。
12681 46
|
11月前
|
数据管理 数据库 数据安全/隐私保护
Django—同一项目不同app使用不同数据库
在Django项目中实现不同app使用不同数据库的配置,可以通过配置多数据库、创建数据库路由和配置路由来实现。通过这种方法,可以有效地将数据隔离到不同的数据库,提高数据管理的灵活性和系统的可扩展性。希望本文能为开发者在Django项目中使用多数据库提供清晰的指导。
279 4
基于粒子滤波器的电池剩余使用寿命计算matlab仿真
本研究基于粒子滤波器预测电池剩余使用寿命(RUL),采用MATLAB2022a实现。通过非线性动力学模型模拟电池老化过程,利用粒子滤波器处理非线性和非高斯问题,准确估计电池SOH变化趋势,进而预测RUL。系统仿真结果显示了良好的预测性能。
|
12月前
|
消息中间件 Java Kafka
【手把手教你Linux环境下快速搭建Kafka集群】内含脚本分发教程,实现一键部署多个Kafka节点
本文介绍了Kafka集群的搭建过程,涵盖从虚拟机安装到集群测试的详细步骤。首先规划了集群架构,包括三台Kafka Broker节点,并说明了分布式环境下的服务进程配置。接着,通过VMware导入模板机并克隆出三台虚拟机(kafka-broker1、kafka-broker2、kafka-broker3),分别设置IP地址和主机名。随后,依次安装JDK、ZooKeeper和Kafka,并配置相应的环境变量与启动脚本,确保各组件能正常运行。最后,通过编写启停脚本简化集群的操作流程,并对集群进行测试,验证其功能完整性。整个过程强调了自动化脚本的应用,提高了部署效率。
2832 1
【手把手教你Linux环境下快速搭建Kafka集群】内含脚本分发教程,实现一键部署多个Kafka节点
|
编解码 人工智能 算法
【AI系统】EfficientNet 系列
本文介绍了EfficientNet系列模型,特别是EfficientNet V1和V2。EfficientNet V1通过NAS技术同时探索网络的宽度、深度和分辨率对模型性能的影响,提出了复合模型缩放方法,以平衡三者关系,实现高效模型扩展。EfficientNet V2在此基础上,引入Fused-MBConv模块,采用渐进式学习策略和自适应正则化技术,进一步提升了模型的训练速度和推理效率。
805 6
【AI系统】EfficientNet 系列
|
JSON API 开发者
解密小红书详情API接口:获取与运用
小红书作为热门社交媒体平台,吸引了大量用户和创作者。企业或开发者可以通过调用小红书API接口,高效、合法地获取内容数据,提升业务效率。本文详细介绍如何获取和使用小红书笔记详情API接口,涵盖注册账号、创建应用、获取API密钥、查阅文档、构建请求、解析响应等步骤,以及应用场景和注意事项。
3496 2