华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍

简介: 华为开源全场景AI计算框架MindSpore,性能可达 Pytorch+2080Ti 的1.93倍

bVbGU2a.jpg

MindSpore 是由华为于 2019 年 8 月推出的新一代全场景 AI 计算框架,2020 年 3 月 28 日,华为宣布 MindSpore 正式开源。

MindSpore 着重提升易用性并降低 AI 开发者的开发门槛。

MindSpore 原生适应每个场景包括端、边缘和云,并能够在按需协同的基础上,通过实现 AI 算法即代码,使开发态变得更加友好,显著减少模型开发时间,降低模型开发门槛。


昇腾 910 和 MindSpore 到底是什么


我们都熟悉的电脑当中有一个很重要的组件叫做 GPU,通常称为显卡,有了它才能处理电脑中的视频、图像信号,GPU 的性能越强能够处理视频信号的能力就越强,通常来说就能玩更大型的游戏,昇腾 910 可以大概理解为是服务器里的显卡,只不过它不是用来进行处理视频信号,而是用其强大的算力对 AI 模型进行训练的。

MindSpore 全场景 AI 计算框架则可以去大致类比电脑中的操作系统,有了它才能让 AI 处理器的强大算力充分发挥出来。


实力被证明


知乎用户 @凯恩博 kevin 博士在参加 MindSpore 学习的系列活动时,申请试用到 ModelArts Ascend 910 做模型训练,之后他实测了 Ascend 910 集群的性能,还与 2080Ti/P100/T4+Pytorch 做了性能对比。

bVbGUdC.png

得出如下结论:

A910 在训练速度约是 2080Ti 的 1.93 倍,而 2080Ti 在 32 位精度下是 V100 80% 性能估算,A910 的训练速度性能至少是 V100 的 1.5 倍以上。


产生了什么影响


华为有了目前世界算力顶尖 AI 处理器,对于人工智能算法模型的训练从过去的几个小时缩短到以分钟为单位,极大便利了开发者,能让 AI 应用更快成型,更容易投入使用,对于我国人工智能生态的形成起到了加速器的作用。

目录
相关文章
|
7月前
|
人工智能 运维 安全
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
迈格网络推出“天机”新版本,以AI自学习、全端防护、主动安全三大核心能力,重构网络安全防线。融合AI引擎与DeepSeek-R1模型,实现威胁预测、零日防御、自动化响应,覆盖Web、APP、小程序全场景,助力企业从被动防御迈向主动免疫,护航数字化转型。
从被动防御到主动免疫进化!迈格网络 “天机” AI 安全防护平台,助推全端防护性能提升
|
7月前
|
人工智能 数据可视化 前端开发
AI Ping:精准可靠的大模型服务性能评测平台
AI Ping是清华系团队推出的“大模型服务评测平台”,被誉为“AI界的大众点评”。汇聚230+模型服务,7×24小时监测性能数据,以吞吐量、延迟等硬指标助力开发者科学选型。界面简洁,数据可视化强,支持多模型对比,横向对标国内外主流平台,为AI应用落地提供权威参考。
1783 3
|
8月前
|
人工智能 编解码 安全
阿里云服务器上新,第9代AMD企业级实例g9ae,提升企业AI业务创新与性能突破
近日,阿里云推出的服务器ECS第9代AMD企业级实例-g9ae实例已开启邀测阶段,g9ae实例基于CIPU 2.0架构,搭载AMD Turin处理器,为国内首创物理核设计的“性能旗舰型”算力产品,专为AI时代企业离线数据处理打造。本文为大家介绍g9ae实例的性能及适用场景,以供了解与参考。
|
6月前
|
机器学习/深度学习 PyTorch TensorFlow
66_框架选择:PyTorch vs TensorFlow
在2025年的大语言模型(LLM)开发领域,框架选择已成为项目成功的关键决定因素。随着模型规模的不断扩大和应用场景的日益复杂,选择一个既适合研究探索又能支持高效部署的框架变得尤为重要。PyTorch和TensorFlow作为目前市场上最主流的两大深度学习框架,各自拥有独特的优势和生态系统,也因此成为开发者面临的经典选择难题。
1211 0
|
7月前
|
机器学习/深度学习 算法 PyTorch
【Pytorch框架搭建神经网络】基于DQN算法、优先级采样的DQN算法、DQN + 人工势场的避障控制研究(Python代码实现)
【Pytorch框架搭建神经网络】基于DQN算法、优先级采样的DQN算法、DQN + 人工势场的避障控制研究(Python代码实现)
191 1
|
7月前
|
机器学习/深度学习 算法 PyTorch
【DQN实现避障控制】使用Pytorch框架搭建神经网络,基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究(Matlab、Python实现)
【DQN实现避障控制】使用Pytorch框架搭建神经网络,基于DQN算法、优先级采样的DQN算法、DQN + 人工势场实现避障控制研究(Matlab、Python实现)
299 0
|
9月前
|
存储 人工智能 API
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
在AI代理系统开发中,上下文工程成为提升系统性能的关键技术。本文探讨了从提示工程到上下文工程的转变,强调其通过为AI系统提供背景信息和工具支持,显著提升智能化程度和实用价值。文章系统分析了上下文工程的理论基础、核心策略(如写入、选择、压缩和隔离),并结合LangChain和LangGraph工具,展示了如何实现上下文工程技术以优化AI代理性能。通过Scratchpad机制、内存管理、RAG系统集成、多代理架构及沙盒环境等技术手段,开发者可以更高效地构建高性能、可扩展的AI系统。
1201 0
AI代理性能提升实战:LangChain+LangGraph内存管理与上下文优化完整指南
|
6月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1456 60

热门文章

最新文章

推荐镜像

更多