新冠病毒破解有了巨大突破,达摩院做了什么?

简介: 阿里巴巴达摩院正在用AI算法抗击新型冠状病毒肺炎疫情。2月1日,浙江省疾控中心上线自动化的全基因组检测分析平台。利用阿里达摩院研发的AI算法,可将原来数小时的疑似病例基因分析缩短至半小时,大幅缩短确诊时间,并能精准检测出病毒的变异情况。

阿里巴巴达摩院正在用AI算法抗击新型冠状病毒肺炎疫情。2月1日,浙江省疾控中心上线自动化的全基因组检测分析平台。利用阿里达摩院研发的AI算法,可将原来数小时的疑似病例基因分析缩短至半小时,大幅缩短确诊时间,并能精准检测出病毒的变异情况。
image

达摩院算法专家顾斐博士在疾控中心基因检测分析现场

当前,全国新型冠状病毒肺炎疫情依然严峻,快速、精确诊断对于疫情控制尤其重要。公开信息显示,该病毒是基因组序列最长的病毒之一,全基因组序列全长29847bp,临床诊断需要将患者样本与该病毒基因序列进行比对才能确定诊断结果。

目前医院普遍采用核酸检测方法,其只能检测到病毒基因的局部。由于病毒存在变异的可能性,对于整个基因序列来说这种检测方法犹如盲人摸象,一旦病毒发生变异,就可能出现漏检的情况。
image

新型冠状病毒结构

不同于传统核酸检测方法,全基因组检测技术可以对疑似病例的病毒样本进行全基因组序列分析比对,能够有效防止病毒变异产生的漏检。此次阿里巴巴达摩院与杰毅生物技术公司联合研发的平台采用的就是全基因组检测方法,其突破之处在于大幅缩短了检测时间。

在基因分析阶段,阿里巴巴达摩院和阿里云弹性计算团队提供的系统还能提供病毒快速拼接能力,将快速精准捕捉变异后的病毒序列,二级结构及三维结构,为病毒疫苗和药物提供了基础。
image

设置基因检测分析参数

诊断效率的提升得益于算法的创新。达摩院团队针对新型冠状病毒基因进行特征分析,并推出多个算法模型。在序列比对过程中,达摩院对算法增加了分布式设计,提升了比对效率;在病毒序列拼接阶段使用分布式设计的de Bruijn图算法,变异病毒也能精准检测。

浙江省疾控中心基因测序负责人孙逸博士表示:“该平台基于阿里云的强大算力与达摩院新算法可以为病毒的解析提供支撑,基于该平台,未来还可以在短时间内将检测范围覆盖整个确诊病例,也为后续疫苗与药物研发打下了坚实基础。”

以下是达摩院算法专家对该平台的解读:

Q:这一平台有何特点?

A:此次研发的自动化全基因组检测分析平台属于高通量测序,平台由浙江省疾控中心、阿里巴巴达摩院、杰毅生物共同研发,可以给浙江省疾控在新型冠状病毒疫情防控上提供了全自动建库和分布式计算分析能力。杰毅生物开发了全自动高通量测序建库仪,把整体常规人工需要12小时的工作缩短到2个小时。每次测序过程会产生海量的数据,达摩院采用分布式设计的分析算法,样本基因分析的速度由数小时缩短到半小时;同时,由于采用分布式算法,病毒拼接的速度由30分钟-1小时缩短到15-30分钟。除此之外,不同于传统核算检测方法,这一平台还可以检测到病毒的全貌,避免因为病毒变异造成的漏检情况。

Q:达摩院团队提供的算法有哪些价值?

A:达摩院针对新冠病毒基因的特征进行了分析,基于pdb等公共数据集的数据进行算法的优化训练。本次分析病毒检测和病毒变异部分主要基于开源算法,设计分布式算法以加速分析流程。病毒序列拼接完成后,通过设计BiLSTM+DNN的方式训练模型预测病毒蛋白二级结构。同时,达摩院还在研究基于序列的蛋白质三维结构预测模型以及药物筛选模型。

本文作者:阿里巴巴达摩院
本文来自“阿里技术”公众号,了解相关信息可以关注“阿里技术”

目录
相关文章
layUI数据表格可编辑扩展下拉框
layUI数据表格可编辑扩展下拉框
486 0
|
Windows
Windows平台如何修改监听的服务名称?
【8月更文挑战第15天】在Windows平台上可透过注册表编辑器、命令提示符或第三方工具修改服务的显示名称。首先,通过注册表编辑器找到`HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services`下的目标服务,修改其“DisplayName”键值。或者,在命令提示符中使用`sc config`命令来变更服务名称。此外,利用第三方工具如Windows Service Manager也能简化此过程。修改前请确保了解可能的影响并做好备份。
694 4
|
数据采集 JSON JavaScript
jsoup爬虫发送get、post请求、解析html、获取json
jsoup爬虫发送get、post请求、解析html、获取json
1196 0
|
数据采集 机器学习/深度学习 TensorFlow
声纹识别实战:从数据采集到模型训练
【10月更文挑战第16天】声纹识别技术通过分析个人的语音特征来验证其身份,具有无接触、便捷的特点。本文将带你从零开始,一步步完成声纹识别系统的构建,包括数据采集、音频预处理、特征提取、模型训练及评估等关键步骤。我们将使用Python语言和相关的科学计算库来进行实践。
2435 0
|
JSON API 数据格式
从零开始:什么是 YAML?
YAML 是 "YAML Ain't Markup Language" 的缩写,这是一种用于数据序列化的基于文本的标记语言。
|
Dubbo 中间件 应用服务中间件
Seata:打造行业首个分布式事务产品
Seata 起源于阿里内部电商业务体系,解决服务化过程中的服务一致性问题,经过了多年标准化建设和大促流量的洗礼,Seata 已成为交易、支付和物流场景的标准化组件。本文将详细介绍微服务架构下数据一致性的挑战,分布式事务 Seata 的架构演进以及如何基于 Seata 扩展 RPC 和数据库。
137517 10
|
存储 开发框架 算法
【自己动手画CPU】控制器设计(二)
作者深入探讨了自制CPU的控制器设计,为自学者提供了宝贵的实践指导。文章详细介绍了控制器的设计原理与关键步骤,涵盖了寄存器的配置、指令的执行以及时序控制等方面内容。通过图文并茂的演示,读者可以清晰了解如何从零开始搭建一个基本的控制器,并使其能够执行简单的指令。作者以通俗易懂的方式呈现技术细节,使初学者能够轻松理解和模仿。
1515 0
【自己动手画CPU】控制器设计(二)
|
数据采集 存储 缓存
牛逼!“京东热” 框架 JD-hotkey 开源了...单机 QPS 可达 37 万!!
牛逼!“京东热” 框架 JD-hotkey 开源了...单机 QPS 可达 37 万!!
7265 0
牛逼!“京东热” 框架 JD-hotkey 开源了...单机 QPS 可达 37 万!!
|
网络安全 数据安全/隐私保护
银河麒麟v10系统SSH远程管理及切换root用户的操作方法
银河麒麟v10系统SSH远程管理及切换root用户的操作方法
7034 0