华为发布算力最强 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore

简介: 华为发布算力最强 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore

[中国,深圳,2019 年 8 月 23 日] 华为正式发布算力最强的 AI 处理器 Ascend 910(昇腾910),同时推出全场景 AI 计算框架 MindSpore。华为公司轮值董事长徐直军在发布会上表示:华为自 2018 年 10 月发布 AI 战略以来,稳步而有序地推进战略执行、产品研发及商用进程。昇腾910、MindSpore 的推出,标志着华为已完成全栈全场景 AI 解决方案(Portfolio)的构建,也标志着华为 AI 战略的执行进入了新的阶段。

image.jpeg8 月 23 日,华为公司轮值董事长徐直军出席 AI 处理器 Ascend 910 及全场景 AI 计算框架 MindSpore 发布会。


昇腾 910,算力最强 AI 处理器

徐直军此次正式发布的 AI 芯片是昇腾910,属于 Ascend-max 系列。在 HC2018 上已经发布了其技术规格。实际测试结果表明,在算力方面,昇腾910 完全达到了设计规格,即:半精度 (FP16)算力达到 256 Tera-FLOPS,整数精度 (INT8) 算力达到 512 Tera-OPS,重要的是,达到规格算力所需功耗仅 310W,明显低于设计规格的 350W。徐直军表示:昇腾910 总体技术表现超出预期,作为算力最强AI处理器,当之无愧。我们已经把昇腾910 用于实际 AI 训练任务。比如,在典型的 ResNet50 网络的训练中,昇腾910 与 MindSpore 配合,与现有主流训练单卡配合 TensorFlow 相比,显示出接近 2 倍的性能提升。面向未来,针对不同的场景,包括边缘计算、自动驾驶车载计算、训练等场景,华为将持续投资,推出更多的 AI 处理器,面向全场景持续提供更充裕、更经济、更适配的AI算力。


MindSpore,全场景 AI 计算框架

徐直军还发布了全场景 AI 计算框架 MindSpore。能否大大降低AI应用开发的门槛,能否实现 AI 无处不在,能否在任何场景下确保用户隐私得到尊重和保护,这些都与 AI 计算框架息息相关。为此,去年华为全联接大会上,华为提出,AI 框架应该是开发态友好(例如显著减少训练时间和成本)和运行态高效(例如最少资源和最高能效比),更重要的是,要能适应每个场景包括端、边缘和云。经过近一年的努力,全场景 AI 计算框架 MindSpore 在这三个方面都取得了显著进展。

全场景支持,是在隐私保护日渐重要的背景下,实现 AI 无所不在越来越基础的需求,也是 MindSpore 的重要特色。针对不同的运行环境,MindSpore 框架架构上支持可大可小,适应全场景独立部署。MindSpore 框架通过协同经过处理后的、不带有隐私信息的梯度、模型信息,而不是数据本身,以此实现在保证用户隐私数据保护的前提下跨场景协同。除了隐私保护,MindSpore 还将模型保护 Built-in 到 AI 框架中,实现模型的安全可信。 在原生适应每个场景包括端,边缘和云,并能够按需协同的基础上,通过实现AI算法即代码,使开发态变得更加友好,显著减少模型开发时间。以一个 NLP(自然语言处理)典型网络为例,相比其他框架,用 MindSpore 可降低核心代码量 20%,开发门槛大大降低,效率整体提升 50% 以上。通过 MindSpore 框架自身的技术创新及其与昇腾处理器协同优化,有效克服 AI 计算的复杂性和算力的多样性挑战,实现了运行态的高效,大大提高了计算性能。除了昇腾处理器,MindSpore 同时也支持 GPU、CPU 等其它处理器。

为了更好促进 AI 的应用,徐直军宣布“MindSpore 将在 2020 年 Q1 开源”,助力每一位开发者,促进 AI 产业生态发展。


全栈全场景 AI 解决方案,让 AI 无处不在

徐直军在发布以上两款产品之前,首先重申了华为公司的 AI 战略:投资 AI 基础研究,在计算视觉、自然语言处理、决策推理等领域构筑数据高效(更少的数据需求) 、能耗高效(更低的算力和能耗) ,安全可信、自动自治的机器学习基础能力;打造全栈全场景解决方案,提供充裕的、经济的算力资源,简单易用、高效率、全流程的 AI 平台;投资开放生态和人才培养,面向全球,持续与学术界、产业界和行业伙伴广泛合作;把 AI 思维和技术引入现有产品和服务,实现更大价值、更强竞争力;应用 AI 优化内部管理,对准海量作业场景,大幅度提升内部运营效率和质量。

华为 AI 解决方案(portfolio)的全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。而全栈是技术功能视角,是指包括 Ascend 昇腾系列 IP 和芯片、芯片使能 CANN、训练和推理框架 MindSpore 和应用使能 ModelArts 在内的全堆栈方案。

徐直军也回顾了制定以上 AI 战略的初衷。华为定位 AI 是一种新的通用目的技术(GPT),如同 19 世纪的铁路和电力,以及 20 世纪的汽车、电脑、互联网一样,将应用到经济的几乎所有地方。同时华为也认为 AI 的应用总体还处于发展初期,AI 技术和能力相比于长远期望还有很大差距。减小甚至消除这些差距,加速AI的应用,正是华为 AI 战略的初衷和目标。具体包括致力于促成以下 10 个方面的改变。

通过提供更强的算力,使复杂模型训练能在几分钟、甚至几秒钟内完成,而不是今天的数天甚至数周;提供更经济、更充裕的算力,让算力不再稀缺、不再昂贵,从而不再是 AI 发展的制约因素;通过全场景方案,适应企业不同需要,确保用户隐私得到尊重和保护,让 AI 能够部署在任何场景,而不仅仅是公有云。投资基础 AI 算法研究,实现更少的数据需求,即数据高效。也要能够基于更低的算力和能耗,即能耗高效。通过 AI 框架 MindSpore 和应用使能 ModelArts,大大提升 AI 自身的自动化水平,减少对人工的依赖。持续提升模型算法,实现工业生产环境的“工作”优秀,而不仅仅是各种比拼环境的“考试”优秀。实现模型的闭环、实时更新,保证企业 AI 应用始终处于最佳状态。将 AI 技术与 5G、云、物联网、边缘计算、区块链、大数据、数据库… 等技术充分协同,发挥更大价值。通过全栈方案一站式平台,使 AI 成为所有应用开发者甚至所有 ICT 技术从业人员的一项基本技能,而不是一项只有具备高级技能的专家才能完成的工作。通过全栈全场景技术手段,结合投资开放的生态和人才培养,让 AI 人才不再短缺

昇腾310 和 ModelArts 获得广泛应用

在华为全联接大会 2018 上,与华为 AI 战略一起, 作为全栈全场景解决方案的首批组件,华为同时对外发布并正式推出了昇腾310 AI 芯片 和全流程模型生产服务 ModelArts。昇腾310 属于 Ascend-mini 系列第一颗华为商用 AI SoC芯片,在最大功耗仅 8W 的情况下,其整数精度(INT8)算力达到 16Tops,半精度(FD16)算力达 到 8Tops,同时,该芯片中还集成了 16 通道 全高清 视频解码器,是面向边缘计算场景最强算力的 AI SoC。

自发布以来,基于昇腾310 芯片的产品和云服务获得广泛应用。其中,基于昇腾310 的 MDC 和很多国内外主流车企在园区巴士、新能源车、自动驾驶等场景已经深入合作。基于昇腾310 的 Atlas 系列板卡、服务器,与数十家伙伴在智慧交通、智慧电力等数十个行业落地行业解决方案。基于昇腾310,华为云提供了图像分析类服务、OCR 服务、视频智能分析服务等云服务。对外提供 API 达 50 多个,日均调用量超过 1 亿次,而且在快速增长,预计年底日均调用量 超过 3 亿次。另有超过 100 多个客户使用昇腾310 开发定制 AI 算法。

ModelArts 全流程模型生产服务打通了从数据获取-模型开发-模型训练-模型部署的全链条,可将生产所需的所有服务一站式提供。截止目前,ModelArts 已经拥有开发者超过 3 万,日均训练作业任务超过 4000 个,32000 小时,其中:视觉类作业占 85%,语音类作业占 10%, 机器学习 5%。

随着今天昇腾910 AI 处理器以及 MindSpore 全场景 AI 计算框架的发布,华为全栈全场景 AI 解决方案各重要组成部分悉数登场,徐直军因此表示“华为已完成了全栈全场景 AI 解决方案的构建”。实现了预期的计划和目标,对华为 AI,这是一个新的里程碑,更是一个新的开始。在发布会最后,徐直军预告,在即将开幕的华为全联接大会 2019,将有更多震撼的AI新品提出。华为期待与伙伴更加深入、广泛的合作,让 AI 无所不及,把数字世界带给每个人、每个家庭、每个组织。

相关文章
|
3天前
|
存储 人工智能 NoSQL
Tablestore深度解析:面向AI场景的结构化数据存储最佳实践
《Tablestore深度解析:面向AI场景的结构化数据存储最佳实践》由阿里云专家团队分享,涵盖Tablestore十年发展历程、AI时代多模态数据存储需求、VCU模式优化、向量检索发布及客户最佳实践等内容。Tablestore支持大规模在线数据存储,提供高性价比、高性能和高可用性,特别针对AI场景进行优化,满足结构化与非结构化数据的统一存储和高效检索需求。通过多元化索引和Serverless弹性VCU模式,助力企业实现低成本、灵活扩展的数据管理方案。
26 12
|
14天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与情感计算:AI如何理解人类情感
人工智能与情感计算:AI如何理解人类情感
94 20
|
3天前
|
存储 人工智能 边缘计算
AI时代下, 边缘云上的技术演进与场景创新
本文介绍了AI时代下边缘云的技术演进与场景创新。主要内容分为三部分:一是边缘云算力形态的多元化演进,强调阿里云边缘节点服务(ENS)在全球600多个节点的部署,提供低时延、本地化和小型化的价值;二是边缘AI推理的创新发展与实践,涵盖低时延、资源广分布、本地化及弹性需求等优势;三是云游戏在边缘承载的技术演进,探讨云游戏对边缘计算的依赖及其技术方案,如多开技术、云存储和网络架构优化,以提升用户体验并降低成本。文章展示了边缘云在未来智能化、实时化解决方案中的重要性。
|
3天前
|
人工智能 缓存 安全
每一个大模型应用都需要一个 AI 网关|场景和能力
本次分享的主题是每一个大模型应用都需要一个 AI 网关|场景和能力。由 API 网关产品经理张裕(子丑)进行分享。主要分为三个部分: 1. 企业应用 AI 场景面临的挑战 2. AI 网关的产品方案 3. AI 网关的场景演示
|
4天前
|
存储 Serverless 文件存储
AI 场景下,函数计算 GPU 实例模型存储最佳实践
当前,函数计算 FC 已被广泛应用在各种 AI 场景下,函数计算支持通过使用容器镜像部署 AI 推理应用,并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用,并快速解决不同场景下的模型存储选型问题,本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析,以期为您的模型存储决策提供帮助。
|
5天前
|
人工智能 运维 Serverless
云端问道8期方案教学-基于Serverless计算快速构建AI应用开发
本文介绍了基于Serverless计算快速构建AI应用开发的技术和实践。内容涵盖四个方面:1) Serverless技术价值,包括其发展趋势和优势;2) Serverless函数计算与AI的结合,探讨AIGC应用场景及企业面临的挑战;3) Serverless函数计算AIGC应用方案,提供一键部署、模型托管等功能;4) 业务初期如何低门槛使用,介绍新用户免费额度和优惠活动。通过这些内容,帮助企业和开发者更高效地利用Serverless架构进行AI应用开发。
|
16天前
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
18天前
|
存储 人工智能 运维
面向AI的服务器计算软硬件架构实践和创新
阿里云在新一代通用计算服务器设计中,针对处理器核心数迅速增长(2024年超100核)、超多核心带来的业务和硬件挑战、网络IO与CPU性能增速不匹配、服务器物理机型复杂等问题,推出了磐久F系列通用计算服务器。该系列服务器采用单路设计减少爆炸半径,优化散热支持600瓦TDP,并实现CIPU节点比例灵活配比及部件模块化可插拔设计,提升运维效率和客户响应速度。此外,还介绍了面向AI的服务器架构挑战与软硬件结合创新,包括内存墙问题、板级工程能力挑战以及AI Infra 2.0服务器的开放架构特点。最后,探讨了大模型高效推理中的显存优化和量化压缩技术,旨在降低部署成本并提高系统效率。
|
18天前
|
存储 人工智能 芯片
面向AI的服务器计算互连的创新探索
面向AI的服务器计算互连创新探索主要涵盖三个方向:Scale UP互连、AI高性能网卡及CIPU技术。Scale UP互连通过ALink系统实现极致性能,支持大规模模型训练,满足智算集群需求。AI高性能网卡针对大规模GPU通信和存储挑战,自研EIC网卡提供400G带宽和RDMA卸载加速,优化网络传输。CIPU作为云基础设施核心,支持虚拟化、存储与网络资源池化,提升资源利用率和稳定性,未来将扩展至2*800G带宽,全面覆盖阿里云业务需求。这些技术共同推动了AI计算的高效互联与性能突破。
|
5天前
|
存储 人工智能 数据管理
云端问道17期方案教学-AI场景下的对象存储OSS数据管理实践
本文介绍了AI场景下的对象存储OSS数据管理实践,由阿里云技术专家明锦分享。主要内容分为两部分:1) AI场景下对象存储实践方案,包括对象存储的应用、优势及在模型推理中的优化;2) OSS常用工具介绍,如OSSFS、Python SDK、Go SDK等,并详细说明了这些工具的特点和使用场景。文中还探讨了不同模式下的性能优化,以及即将推出的OS Connector for AI/ML工具,旨在提升数据下载速度和IO性能。

热门文章

最新文章