【阅读原文】戳:磐久服务器云栖再创新 高密计算和算力原生已成趋势
11月3日-5日,2022云栖大会在杭州云栖小镇举行。上千位院士、科学家、学者、行业领军者参与其中,通过两场重磅主论坛、60多场峰会和分论坛,带来关于数字产业和数字技术的1000多个话题分享,碰撞最前沿的技术与思想。
作为磐久基础设施的关键资源之一,磐久服务器自去年云栖大会发布以来,在计算架构演进、硬件资源池化和算力原生实践方面也取得了新的突破,在2022云栖大会《从芯到系统的服务器算力创新》分论坛,以及“计算之力”主题展馆磐久基础设施服务器展区,整体展示了服务器部件和架构设计领域最新的技术创新进展。
《从芯到系统的服务器算力创新》分论坛从产业和高校技术创新、芯片产业技术创新、服务器技术创新等多个维度,给现场观众带来了当前业界最新的芯片定制、chiplet优化、服务器架构创新最新成果,以及算力原生平台建设领域的实践经验,整体呈现当前数据中心算力提升领域的关键技术,以及未来的发展之路。
从芯到系统的磐久服务器算力创新核心亮点
Debendra Das Sharma博士
CXL联盟创始人、UCIe董事会Chairperson、Intel资深院士
基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径:以智算为代表的高密算力及其高速增长,带来了对芯片晶体管密度进一步增长的强劲需求,而摩尔定律持续放缓又带来了芯片成本高企,严重制约了算力的实现和部署。在这样的背景下,基于芯粒(Chiplet)设计和封装已成为当前芯片设计的必然途径,而硅片间互联则是该芯片设计模式下的关键。UCIe旨在打造业界统一的片间互联技术标准,推动基于硅片的商业化复用,从而打造后摩尔时代低成本、高效互联的芯片设计新范式和商业生态,为高密算力的进一步发展奠定基础。
郭锐
阿里云基础设施服务器研发资深技术专家
新一代服务器高密度计算架构率先亮相:阿里云服务器持续创新,顺应“双碳”和“一云多芯”趋势,以及CIPU云计算架构带来的革命性变化,率先推出高可用的高密算力集群服务器系统。首先是基于方升架构3.0的高密计算架构,此次推出1U两节点磐久服务器高性能计算系列,未来会推出更高节点密度的系列,计算密度倍数增长,以满足快速增长的业务对高性能算力的需求;其次,通过服务器计算、存储等硬件资源模块化和池化,实现云服务器配置的灵活性及智能化,从而匹配客户的多样化需求;另外,全新推出的支持低碳、环保、高效能的浸没式液冷系统,包含了高功率浸没式Tank,且支持高可靠54V集中供电架构等。
孔阳
阿里云基础设施服务器研发高级技术专家
高速互联技术CXL在内存池化应用中落地:磐久服务器研发团队推出的基于CXL的机柜内互联方案,以200ns以内的超低延迟,百GB传输带宽,实现计算池、内存池、存储池的机柜池化系统。在数据库内存池化应用场景,支持超大容量TB级共享内存;提供极致的CPU和内存利用率;提高VM/容器发布和迁移效率,可实现秒级迁移,整体效率提升2~3个数量级。极大满足云原生业务对服务器系统极致弹性、资源共享等方面的诉求。
陈文智教授
浙江大学信息技术中心主任
云原生的算力助力高校科研创新和学科交叉新模式:“研在浙大”平台是浙大在高校信息化、数字化领域的创新实践标杆,为校内计算、AI等科研提供校内纳管底座和算力资源平台。科研领域的多样性,以及算力硬件的多样化,为“研在浙大”平台的构建带来了许多挑战。浙大计算机系统结构实验室ARCLab联合阿里云探索以算力为中心的计算体系架构演变,尝试通过云原生技术抽象CPU/GPU等硬件算力,构建网上浙大的算力底座,让算力更好地服务浙大科研,让高校信息化走在科技前沿。
王楠
阿里云基础设施服务器研发高级技术专家
震旦vODLA为云计算提供标准化、高性能、普惠的异构算力:随着AI、自动驾驶和元宇宙对算力需求的迅速增长,异构算力资源显然已成为云计算最重要的基础设施之一。阿里云震旦vODLA通过面向算力原生的设计,实现了一套集异构算力抽象、度量、调度、使能于一体的技术和能力,通过整合多样化的异构算力资源,为云计算提供标准化、高性能、普惠的异构算力。2022年9月,联手灵骏智算平台,完成了MLPerf™推理榜单网络模式类别的首次提交,第一次以虚拟算力的方式,将此前榜单上最好成绩的24卡GPU算力提升至32卡行业主流GPU算力,突破了系统级PCIe插槽和Pod网络链接数量的物理限制。另外,2022 天猫双十一的首猜场景基于震旦vODLA,达成了性能提升3-5倍。
陈烽
阿里云基础设施供应链资深专家
段光锐
阿里云天基供应链高级专家
C2F商业模式让用户直连工厂,创服务器智能智造标杆:阿里云运用智能制造、大数据、边缘计算、运筹优化等相关技术,构建了全自动化的智能工厂,前端商城支持内部用户灵活匹配,供应能力实时可视,需求直达工厂,实现了秒级全链路承诺交期的能力。智能排产采用线边仓储一体化,对物料和资源进行实时动态匹配。自动化模组线采用软件定义产线设计理念,通过云化调度中心对设备与工艺流程进行仿真、统一调度和动态优化,实现柔性化生产4小时下线。
算力原生圆桌论坛
图 |从左到右为:阿里云基础设施服务器研发高级技术专家卢晓伟、Intel数据中心和人工智能事业部首席工程师胡潇、NVIDIA解决方案工程中心高级技术经理路川、瀚博半导体创始人&CTO张磊、登临科技联合创始人& 首席架构师王平、浙江大学信息技术中心主任陈文智教授
产业大咖共议高弹性、高适应性和低成本的算力原生,正在让算力资源更加简单、普惠和易用。随着企业数字化和智能化的转型,对于算力的需求越来越大,同时计算硬件也在进行多样化的演进,CPU、GPU、ASIC层出不穷,新硬件为应用带来了创新和算力成本的降低,同时也带来了应用复杂性,需要研发、测试到运维等各个层面的适配和调优,从而带来了人力成本的提升。算力原生技术,依托成熟的云原生技术,提供vXPU算力虚拟化能力,让用户真正面向算力开发应用,而非关注具体的硬件,从而减少专业而复杂的硬件适配成本。
此外,本次云栖大会,阿里云与中国移动联合发布了基于震旦vODLA技术的《面向智算的算力原生白皮书》,后续将通过开源开放,持续推动算力原生技术的生态建设,以更加普惠、简单的算力助力企业智能化发展。
“计算之力”主题展馆,“磐久基础设施”展区服务器最新技术产品展示
- 磐久服务器产品新进展:
从上到下展示为:1U两节点磐久服务器M系列和5U OAM模组磐久服务器G系列
- 自研部件:
从上到下展示为:Alimemory CXL内存、AliFlash Ultrastor SCM和大计算智能网卡EIC
- 前沿创新研究:
从上到下展示为:共享内存池服务器微型集群Demo及其软硬件架构图
- 解决方案:
震旦vODLA算力原生+磐久服务器+灵骏解决方案
如您对《从芯到系统的服务器算力创新》分论坛的具体内容感兴趣,您还可以点击此处,访问云栖大会官网,观看我们为您准备的精彩回放。
我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。
获取关于我们的更多信息~