唯一云厂商 I 阿里云高分通过可信云“一云多芯”全部标准测试
在第十届可信云大会上,国内首个《一云多芯技术能力标准体系》由中国信息通信研究院和中国通信标准化协会联合发布。该标准体系涵盖了五大类标准,包括:IaaS平台能力要求、PaaS平台能力要求、PaaS性能要求、云管平台能力要求、稳定性度量评估。在严格的测试标准下,阿里云飞天企业版高分通过全部五项测试,并均获得最高级认证,是首批通过全部标准企业中唯一的云计算厂商。
更轻松、高效、经济的LLaMA训练——开源大模型训练框架Megatron-LLaMA
9月12日,淘天集团联合爱橙科技正式对外开源大模型训练框架——Megatron-LLaMA,旨在让技术开发者们能够更方便地提升大语言模型训练性能,降低训练成本,并保持和LLaMA社区的兼容性。测试显示,在32卡训练上,相比HuggingFace上直接获得的代码版本,Megatron-LLaMA能够取得176%的加速;在大规模的训练上,Megatron-LLaMA相比较32卡拥有几乎线性的扩展性,且对网络不稳定表现出高容忍度。目前Megatron-LLaMA已在开源社区上线。开源地址:https://github.com/alibaba/Megatron-LLaMA
首次!统一调度系统规模化落地,全面支撑阿里巴巴双 11 全业务
今年双 11 首次规模化亮相的统一调度,通过一套调度协议、一套系统架构,统一管理底层的计算、存储、网络资源,超大规模、高效率、自动化的资源弹性,实现了业界新的突破。在离线混部、离在线混部、新的快上快下技术,减少数万台服务器采购,带来数亿计的资源成本优化和大促效率提升。