刚刚,我们一起登上国际顶级学术期刊《Cell》

简介: 刚刚,我们一起登上国际顶级学术期刊《Cell》


10月10日,阿里云与中山大学合作的科研成果登上国际顶级学术期刊《Cell》,研究团队利用云计算与AI技术发现了180个超群、16万余种全新RNA病毒,是已知病毒种类的近30倍,大幅提升了业界对RNA病毒多样性和病毒演化历史的认知。




病毒与人类的健康密切相关,但人类已知已确认的病毒种类仅有5000余种,这只是病毒世界的冰山一角。传统RNA病毒鉴定方法高度依赖于序列同源性比对,即通过比较未知病毒与已知病毒的序列相似性来进行识别。然而,RNA病毒种类繁多且高度分化,传统方法难以捕捉缺乏同源性或同源性极低的“暗物质病毒”,新病毒发现的效率较低。


AI与病毒学研究的结合正在突破这一难题。本篇论文提出了全新的深度学习模型"LucaProt",它基于Transformer框架与大模型表征技术,结合蛋白质序列和内在结构性特征,在独立的测试数据集上表现优异,具有极高的准确性(假阳性率仅为0.014%)和特异性(假阴性率为1.72%)。


image.png


研究团队对来自全球生物环境样本的10,487份数据进行病毒挖掘,发现了513,134条病毒基因组,代表161,979个潜在病毒种及180个RNA病毒超群。使RNA病毒超群数量扩容约9倍,病毒种类增加约30倍,其中23个超群无法通过序列同源方法识别,被称为病毒圈的“暗物质“。


该论文还揭示了多个病毒学领域新发现:发现迄今为止最长的RNA病毒基因组,长度达到47,250个核苷酸;识别出超出以往认知的基因组结构,展示了RNA病毒基因组进化的灵活性;此外,在高温的深海热泉等极端环境中,RNA病毒依旧存在多样性。


过去几年,阿里云积极与国内高校和研究机构展开合作,在生命科学领域已发表核酸和蛋白质统一基础模型-LucaOne、RNA病毒发现-LucaProt、磷循环蛋白家族识别-LucaPCycle等研究成果。


《Cell》是国际公认学术声誉最高的期刊,代表生命科学领域的最高水平。国内每年入选《Cell》的论文数量仅有数十篇。此次入选的论文提出了一种基于深度学习的RNA病毒发现方法,是深度学习算法在病毒发现领域的里程碑式进展,为病毒学研究开创了全新范式。


/ END /

目录
相关文章
|
存储 弹性计算 编解码
ecs实例规格业务类型
阿里云ECS提供多样化实例规格,涵盖通用、计算、内存、存储、GPU、FPGA/ASIC和弹性伸缩型实例,适应不同业务场景。例如,通用型适合日常Web服务,计算型用于高性能计算,内存型适用于内存数据库,GPU实例支持图形和AI计算,而弹性伸缩实例则可根据负载动态调整资源。各规格族内有不同实例大小,满足用户个性化需求。
387 3
|
2月前
|
人工智能 Cloud Native 自然语言处理
拔俗AI智能体服务开发:你的7x24小时数字员工,让企业效率飙升的秘密武器
在“人效为王”时代,企业面临服务响应慢、成本高、协同难等痛点。阿里云AI智能体以自主决策、多模态交互、持续学习三大引擎,打造永不疲倦的“数字员工”,实现7×24小时高效服务,助力企业降本增效、驱动创新增长。(238字)
|
11月前
|
机器学习/深度学习 人工智能 编解码
ByteDance Research登Nature子刊:AI+冷冻电镜,揭示蛋白质动态
在生物医学领域,蛋白质的结构与功能研究至关重要。ByteDance Research团队开发的CryoSTAR软件,结合AI与冷冻电镜技术,通过深度学习模型、结构先验和异质性重构算法,成功解析了蛋白质的动态行为,尤其在处理结构异质性方面表现出色。该软件已在多个蛋白质体系中取得显著成果,如TRPV1通道蛋白的动态变化研究,为理解蛋白质功能及疾病机制提供了新思路。论文链接:https://www.nature.com/articles/s41592-024-02486-1
355 26
|
人工智能 安全 搜索推荐
1.8B参数,阿里云首个联合DNA、RNA、蛋白质的生物大模型,涵盖16.9W物种
【6月更文挑战第14天】阿里云发布首个集成DNA、RNA和蛋白质数据的生物大模型LucaOne,拥有1.8B参数,涉及16.9万物种。LucaOne通过few-shot learning技术和streamlined downstream architecture实现多生物语言统一处理,提升生物系统理解与分析能力。该模型将加速生物信息学研究,推动生物医学应用,但同时也引发生物数据安全、预测偏差及AI伦理法律等问题的讨论。[论文链接](https://www.biorxiv.org/content/10.1101/2024.05.10.592927v1)
941 3
|
10月前
|
人工智能 自然语言处理 负载均衡
零门槛体验DeepSeek-R1满血版
本文介绍了阿里云通过百炼平台的API调用DeepSeek开源模型的体验过程,如何开通服务、获取API-KEY、下载并配置chatbox客户端。此外,文中展示了多种部署方案,方便用户根据自身需求选择最优方式。
1697 9
零门槛体验DeepSeek-R1满血版
|
关系型数据库 芯片
ovp过压过流保护芯片,大电流限流,高压,选型大齐全
本文介绍了过压保护(OVP)和过流限流保护(OCP)的基本概念及其应用场景,如蓝牙耳机、充电宝等。文中推荐了几款平芯微的OVP/OCP保护芯片,包括单OVP芯片PW1600、W2609A、PW2605,以及OVP和OCP二合一的PW1605、PW1558A、PW1515等,详细列出了各芯片的主要特点和适用范围。
ovp过压过流保护芯片,大电流限流,高压,选型大齐全
|
机器学习/深度学习 存储 人工智能
谢赛宁新作:表征学习有多重要?一个操作刷新SOTA,DiT训练速度暴涨18倍
谢赛宁团队提出REPA方法,通过将扩散模型中的噪声输入隐藏状态与外部预训练视觉编码器的干净图像表征对齐,显著提升扩散模型的训练效率和生成质量,为扩散模型在表征学习上的应用开辟新路径。
383 5
|
SQL 关系型数据库 MySQL
关系型数据库mysql跨平台兼容性
【6月更文挑战第13天】
770 4
|
机器学习/深度学习 算法 数据库
R-CNN论文详解(入门目标检测必读)
R-CNN论文详解(入门目标检测必读)
R-CNN论文详解(入门目标检测必读)