阿里云AI智算获“算力中国”年度突破大奖

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,5000CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 阿里云AI智算获“算力中国”年度突破大奖


昨日,由工业和信息化部、宁夏回族自治区人民政府共同举办的2023中国算力大会在银川举行。会上公布了算力领域最具影响力专家学者共同评选出的算力中国·年度突破成果,阿里云“PAI灵骏智算服务”作为国内AI智算基础设施代表获得该重磅奖项。




“算力中国·年度突破成果”奖项为攻坚算力领域中的热点、难点和关键问题设立,秉承“开创性、引领性、权威性、公平性”原则,旨在发掘在算力或相关产业达到全球领先水平的基础理论、创新方法、方法模式和平台应用的创新成果。


评审委员会由中国科学院院士、中国工程院院士、知名高校及科研机构专家、领军企业技术带头人组成,集聚中国算力相关领域最具影响力的专家学者。



“PAI灵骏智算服务”是阿里云面向高速增长的AI计算需求打造的算力基础设施服务,可一站式为企业及开发者提供AI开发全流程的工程平台和智能算力。它具有超大并行计算规模、高性能、高效率、高利用率等特点,具备高达10万卡量级的集群可扩展规模,能支撑多个万亿参数大模型同时训练,其中单训练任务可达万卡规模,千卡规模的线性扩展效率达92%。


在此前实践锤炼中,PAI灵骏智算服务稳定支撑了10万亿参数多模态大模型的低能耗训练,在通义千问等大模型的训练和应用中,将大模型训练效率显著提高近 10 倍,推理效率提升2倍以上。


该奖项认为,阿里云PAI灵骏智算服务:

以高性能网络、高性能文件存储、高稳定性、极致软硬件联合优化能力和serverless化服务能力,为大模型研究、AI for Science、AIGC等场景提供坚实支撑。


PAI灵骏智算服务在多个核心技术领域具备领先性和创新性。动辄上千亿参数的大模型训练,并非靠简单“堆显卡”就能完成,而是囊括底层算力、网络、存储、数据计算、AI框架等复杂技术的系统性工程。除了要通过精巧的设计实现超大计算工程落地外,还要做到“又快又省”,“榨干每一滴算力性能”。


在IaaS基础设施层:阿里云打造了智能计算集群灵骏,通过端网一体、软硬融合的可预期网络技术对集群计算资源进行统筹和优化,实现芯片间微秒级稳定互联和高效并行计算。


相关技术创新大幅消除了AI算力拓展性瓶颈,灵骏集群规模最大可拓展至“10万卡级”,能为大模型的开发和应用提供灵活多尺度的智能算力,对上层平台应用提供便捷的容器化服务。



在PaaS平台服务层:阿里云机器学习平台PAI可对庞大训练任务进行自动分拆和分配,通过硬件、网络、框架一体化协同调度能力,提供速度最快、算力最省的高性能分布式训练方案


同时,PAI配置了自动容错训练框架AIMaster,在大语言模型动辄数周、数月的训练周期中,提供极致的稳定性保障,减少人工介入成本,可将大模型训练时间缩短10倍。此外,PAI提供简单易用的RLHF强化学习框架,能大幅提升大语言模型效果表现。



PAI灵骏智算服务还推出了国内首个serverless化智算服务模式,提供一键开通、按需分配、极简运维的用户体验,支持AI计算资源灵活复用,可大幅提升集群利用率,降低客户的使用成本。


目前,阿里云PAI灵骏智算服务已被众多企业及科研单位应用。阿里云与小鹏汽车合建的智算中心“扶摇”成为国内最大的自动驾驶智算中心,将小鹏汽车自动驾驶模型训练速度提升170倍以上。


阿里云与复旦大学共同打造的云上智算平台CFFF,近期发布了45亿参数量的中短期天气预报大模型,将预测速度从原来的小时级缩短到了3秒内。



/ END /

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
7天前
|
人工智能 Cloud Native 数据管理
媒体声音|重磅升级,阿里云发布首个“Data+AI”驱动的一站式多模数据平台
在2024云栖大会上,阿里云瑶池数据库发布了首个一站式多模数据管理平台DMS:OneMeta+OneOps。该平台由Data+AI驱动,兼容40余种数据源,实现跨云数据库、数据仓库、数据湖的统一数据治理,帮助用户高效提取和分析元数据,提升业务决策效率10倍。DMS已服务超10万企业客户,降低数据管理成本高达90%。
|
7天前
|
存储 人工智能 调度
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
2天前
|
人工智能 架构师
活动火热报名中|阿里云&Elastic:AI Search Tech Day
2024年11月22日,阿里云与Elastic联合举办“AI Search Tech Day”技术思享会活动。
|
2天前
|
存储 人工智能 大数据
阿里云吴结生:高性能计算持续创新,响应数据+AI时代的多元化负载需求
在数字化转型的大潮中,每家公司都在积极探索如何利用数据驱动业务增长,而AI技术的快速发展更是加速了这一进程。
|
6天前
|
人工智能 Kubernetes 云计算
第五届CID大会成功举办,阿里云基础设施加速AI智能产业发展!
2024年10月19日,第五届中国云计算基础架构开发者大会(CID)在北京朗丽兹西山花园酒店成功举办。本次大会汇聚了来自云计算领域的众多精英,不同背景的与会者齐聚一堂,共同探讨云计算技术的最新发展与未来趋势。
|
6天前
|
人工智能 Kubernetes 云计算
第五届CID大会成功举办,阿里云基础设施加速AI智能产业发展!
第五届中国云计算基础架构开发者大会(CID)于2024年10月19日在北京成功举办。大会汇聚了300多位现场参会者和超过3万名在线观众,30余位技术专家进行了精彩分享,涵盖高效部署大模型推理、Knative加速AI应用Serverless化、AMD平台PMU虚拟化技术实践、Kubernetes中全链路GPU高效管理等前沿话题。阿里云的讲师团队通过专业解读,为与会者带来了全新的视野和启发,推动了云计算技术的创新发展。
|
7天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置选项,包括CPU+GPU、CPU+FPGA等组合,支持高性能计算需求。本文汇总了阿里云GPU服务器的价格信息,涵盖NVIDIA A10、V100、T4、P4、P100等多款GPU卡,适用于人工智能、机器学习和深度学习等场景。详细价格表和实例规格见文内图表。
|
3天前
|
存储 XML 人工智能
深度解读AI在数字档案馆中的创新应用:高效识别与智能档案管理
基于OCR技术的纸质档案电子化方案,通过先进的AI能力平台,实现手写、打印、复古文档等多格式高效识别与智能归档。该方案大幅提升了档案管理效率,确保数据安全与隐私,为档案馆提供全面、智能化的电子化管理解决方案。
70 48
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
当前AI大模型在软件开发中的创新应用与挑战
【10月更文挑战第31天】2024年,AI大模型在软件开发领域的应用取得了显著进展,从自动化代码生成、智能代码审查到智能化测试,极大地提升了开发效率和代码质量。然而,技术挑战、伦理与安全问题以及模型可解释性仍是亟待解决的关键问题。开发者需不断学习和适应,以充分利用AI的优势。
|
3天前
|
人工智能 安全 测试技术
探索AI在软件开发中的应用:提升开发效率与质量
【10月更文挑战第31天】在快速发展的科技时代,人工智能(AI)已成为软件开发领域的重要组成部分。本文探讨了AI在代码生成、缺陷预测、自动化测试、性能优化和CI/CD中的应用,以及这些应用如何提升开发效率和产品质量。同时,文章也讨论了数据隐私、模型可解释性和技术更新等挑战。

热门文章

最新文章

下一篇
无影云桌面