飞桨x昇腾生态适配方案：00_整体方案介绍

2025-05-06 383

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 本文详细介绍PaddlePaddle与NPU的适配工作，涵盖训练与推理支持、性能优化及离线推理方案。PaddleCustomDevice作为适配层，支持主流模型（详见飞桨-昇腾模型列表），多数性能媲美V100，部分调优模型接近0.8*A800。硬件适配主要针对A2芯片，A1兼容但310系列建议离线推理。提供常用模型仓链接及整体方案导览，包括环境准备、算子适配、性能调优和Paddle转ONNX/OM等内容。

前言

本文重点介绍Paddle与NPU的适配工作，PaddlePaddle是一个深度学习框架，类似于pytorch；PaddleCustomDeviece是适配层代码，类似于pytorch adapter；模型侧代码根据领域分为PaddleNLP、PaddleMix、PaddleClas、PaddleOCR等。
如果需要运行在线的训练或者推理，可以直接参考模型仓的README，并更改deviece为NPU即可。当前已经支持了大部分主流模型且在持续增加中，具体的模型列表可参照飞桨-昇腾模型支持列表，大部分模型的性能基本持平V100，少部分专项调优模型可以达到0.8*A800（主要是大模型，多模态）。
如果在线推理性能较差且只需要推理的场景，统一建议使用离线场景，Paddle2ONNX工具转化为ONNX，并使用atc转换为OM，具体可参照Paddle转OM以及离线推理章节内容。
硬件适配说明
当前的适配工作主要针对A2芯片，以下所有内容如果没有特殊说明都只针对A2芯片；
A1芯片在大部分情况下没有问题，且使用方式与A2相同，如遇到类似项目可自行使用相同方式进行验证，遇到问题单点支撑；
310系列芯片没有进行过适配，建议直接走离线推理路径。
常用Paddle模型仓
NLP代码仓PaddleNLP：https://github.com/PaddlePaddle/PaddleNLP
多模态代码仓PaddleMIX：https://github.com/PaddlePaddle/PaddleMIX
小模型总体仓库PaddleX：https://github.com/PaddlePaddle/PaddleX
其余仓库可查看Paddle主页面：https://github.com/PaddlePaddle

飞桨x昇腾生态适配方案：00_整体方案介绍

前言

硬件适配说明

常用Paddle模型仓

整体方案导览

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

飞桨x昇腾生态适配方案：00_整体方案介绍

前言

硬件适配说明

常用Paddle模型仓

整体方案导览

热门文章

最新文章

相关电子书