图:阿里云高性能计算研发负责人何万青
8月5日,在2022阿里云生命科学与智能计算峰会上,阿里云高性能计算研发负责人何万青发布了《生命科学行业云上解决方案及最佳实践》白皮书,同时推出高性能容器、大内存、高IO等三大高性能计算解决方案,满足基因测序与AI制药领域中海量级数据分析、作业流程与环境各异等场景需求。
生命科学行业发展至今,早已离不开高性能计算(High Performance Computing)的辅助,从计算机辅助药物设计、疫苗研发,到通过基因检测提供精准医疗服务、产前筛查等,高性能计算HPC在生命科学研究中扮演着十分重要的角色。
随着云计算技术服务及实践的日趋成熟,越来越多的行业通过上云实现了整个产业的转型升级,正处于黄金时期的生命科学行业也不例外。然而,目前针对生命科学行业的解决方案大部分都为线下IDC超算集群方案,随着基因组学、生物制药技术的不断演进及计算机科学的不断发展,传统计算机集群资源已无法满足生命科学行业及技术演进的需求。
本次发布的《生命科学行业云上解决方案及最佳实践》白皮书指出,生命科学企业的 IT 基础设施主要面临资源规模固定、建设周期长和硬件资源运维成本高三大问题。同时生命科学行业也希望拥抱公共云架构、使用异构计算与人工智能等新技术。
何万青表示,云上高性能计算是目前HPC建设使用的最佳途径。
在原来公共云与混合云两大解决方案的基础上,针对生命科学行业的不同需求,阿里云在该白皮书中新发布了高性能容器、大内存、高IO等三大高性能计算解决方案,共计五大解决方案:
1. 公共云解决方案:提供一套通用的公共云架构的解决方案,满足用户快速便捷使用云上 HPC 服务的需求,并基于业务的高峰和低谷动态进行计算资源的弹性扩缩容,有效节省业务成本。方案尤其适用于快速发展的生命科学企业。
2. 混合云架构解决方案:部分企业拥有线下 IDC 数据中心,但基础设施偏旧。随着业务的快速增长,希望可以使用阿里云 E-HPC 提供的强劲新算力,同时利旧IDC数据中心资源。这种情况可用混合云架构统一管理云上云下资源,与公共云打通,支持弹性扩缩容。企业可按需选择管理节点设置在云上或云下。
3. HPC+AI 的高性能容器方案:适用于药物研发和业务流程复杂多样的生信业务,涉及应用版本众多、依赖环境复杂,不同的工作流可能基于不同的操作系统和编译器构建。阿里云E-HPC高性能容器应用eStack可让使用多种软件栈的生信应用运行在同一个平台,便捷管理,支持多种调度器和底层资源,兼容性非常高。
4. 生信行业应用大内存解决方案:阿里云与合作伙伴 Memverge 联合推出,适用于需要进行海量数据分析的业务,如基因测序中每个细胞的表达量数据高达数十万条读取 (reads),这种海量级的数据分析需要大内存容量。使用部署 MemVerge Memory Machine 软件的 ECS i4p 实例作为计算节点,可满足业务对性能的极致要求,同时阿里云E-HPC可自动纳管所有节点。
5. 生信行业应用高 IO 解决方案:基因组织学研究产生的数据增长快速且需永久保存,要求存储系统具有海量容量及高扩展性。另外,基因研究应用软件种类众多,部分计算任务对 IO 吞吐要求很高。对此,阿里云与合作伙伴联科集团联合推出生信行业应用高 IO 解决方案。
上述解决方案可以覆盖生命科学行业的绝大多数场景与需求,拥有覆盖全球的丰富算力,极致性能,弹性伸缩能力帮助客户降本提效,管控可视化帮助用户省心运维等优势。目前,阿里云高性能计算广泛应用于工业仿真(CAD/CAE)、芯片设计(EDA)、生物医药材料、能源勘探与公共服务等多个行业。
「深势科技」利用弹性供应的成本优化策略,结合抢占式实例的价格,以30%的成本完成海量资源的交付。同时云上弹性高性能计算E-HPC自动运维的特性,降低了深势科技的运维成本,提升了集群管理效率。
生命医学企业「圣庭医疗」通过上云优化了传统IDC集群的数据可靠性、运维成本及效率问题,基因比对与分析效率提升了70%。阿里云高性能计算团队还通过结合Slurm业务工作流dependency与自动伸缩的结合,减少了无效的计算资源浪费,有效降低了使用成本。
在本次峰会上,天池大赛—“创新大师杯冷冻电镜蛋白质结构建模大赛”颁奖典礼也同期举行,全球近2000名参赛者一同探索云计算与蛋白质研究的前沿课题,大赛全程从阿里云E-HPC平台、英特尔第三代至强可扩展处理器(Cooper Lake)、深度学习加速和增强型AVX-512指令集等软硬件结合的角度进行全程辅导和训练,推动全行业对人才培养的持续关注。
点击这里,观看本次峰会重磅嘉宾的精彩演讲视频。
行业白皮书下载: