近日,2024年度IT168“技术卓越奖”评选结果揭晓,飞天企业版异构算力调度平台凭借在政企云平台兼容性、稳定性和性能方面的出色表现,获评2024年度技术卓越奖。
IT168创立于1999年,历经25年的发展,现已成为中国IT领域极具影响力的权威媒体机构。IT168“技术卓越奖”评选活动自2004年起举办,至今已有逾二十年的历史,被广泛誉为行业发展的权威风向标。评选秉持中立、客观、专业原则,由资深编辑、行业专家及知名博主组成评审委员会,基于前沿技术和创新产品的深度研究及用户反馈,构建科学评估体系。
随着人工智能技术的飞速发展,特别是大规模预训练模型的兴起,模型训练面临着前所未有的挑战。如何提供大规模、高性能、高可用并支持分布式计算的计算资源,以有效提升大规模预训练模型的训练和推理效率,成为机器学习和大模型领域亟待攻克的核心难题。
本次参评的飞天企业版异构算力调度平台应运而生。作为阿里云面向高性能算力数据中心场景自研的一款AI IaaS产品,产品可支持大规模高性能的算力管理平台,可将物理服务器通过云计算的方式按需弹性地为租户多样化高性能算力集群服务,并高度集成高性能存储以及RDMA网络,做到一键创建高性能算力集群。
飞天企业版异构算力调度平台开放兼容国内外主流芯片,提升用户供应链安全性,同时可纳管用户自有IDC,通过多样化的兼容性接入体系打造开放的算力接入平台。
在稳定性方面,飞天企业版异构算力调度平台打造AI资源可视化、可诊断、可自愈体系,降低由于GPU等硬件高故障率对上层AI训练作业带来的影响,保障智算云平台稳定性。
当前,飞天企业版异构算力调度平台已被应用解决AI场景下的大规模计算、存储和网络资源的需求,全面满足政企客户大规模预训练模型对性能、扩展性、稳定性和开放性方面的要求。