搞定昇腾软件版本配套问题

简介: 开发者拿到一个裸机环境,如800I A2/800T A2, 或Atlas 800 3000推理服务器(里面插了Iduo卡),需要用户根据OS版本去安装配套的固件驱动、Mind系列软件等。

场景

开发者拿到一个裸机环境,如800I A2/800T A2, 或Atlas 800 3000推理服务器(里面插了Iduo卡),需要用户根据OS版本去安装配套的固件驱动、Mind系列软件等。

物理机安装场景

1.先看安装指导:
点击链接

2.查询操作系统兼容性:
点击链接

3.确认固件驱动和CANN版本配套:
点击链接
一般建议选择新版本CANN和固件驱动,固件驱动有多个兼容版本,建议选最新版本。(可以根据软件发布时间来判断版本的新旧)

4.选择配套的Mind系列软件包:
点击链接
选择要安装的软件包,点击勾选:

根据上面步骤3确定的CANN版本,来选择配套资源;也可以勾选CPU架构。

容器安装场景

1.确认宿主机的驱动固件版本

npu-smi info

2.根据驱动固定,选择对应的镜像
镜像仓库链接:https://www.hiascend.com/developer/ascendhub

以MindIE镜像仓库为例:
提供了多个镜像版本

以1.0.0为例,先查询对应的CANN版本(参考《物理机安装场景》步骤4)
看到1.0.0建议配套cann8.0.0.beta1

再根据CANN版本去匹配驱动固件版本(参考《物理机安装场景》步骤3)
确认宿主机安装的驱动固件版本是否满足要求,不匹配需要升级固件驱动版本,操作参考链接

推荐使用方式

一般推荐使用容器安装方式。

一般用户是根据自己的业务场景,比如说要跑DeepSeek满血版推理,则需要去看对应的镜像哪个版本满足要求,然后再根据镜像安装的CANN版本去看宿主机的固件驱动版本是否满足,如果不满足需要升级驱动固件。

相关文章
|
11月前
|
物联网 容器
基于llama-factory的昇腾实战
基于llama-factory的昇腾全流程实践,包括环境的安装、推理部署、微调、动态Lora和对话。
基于llama-factory的昇腾实战
|
19天前
|
Ubuntu Linux Windows
Rufus中文版U盘启动盘制作工具使用全攻略(图文版)
Rufus是一款免费开源、体积仅约2MB的便携式U盘启动盘制作工具,免安装、自带简体中文,支持UEFI+BIOS双模式,写入快、校验准,轻松将Windows/Linux等ISO镜像写入U盘。(239字)
|
5月前
|
Ubuntu Linux 测试技术
Linux系统离线安装Docker完整指南
本文详细介绍在Ubuntu 24等Linux系统中离线安装Docker的完整流程,适用于内网隔离环境。涵盖安装包下载、`docker.service`配置、安装与卸载脚本编写、权限设置、镜像测试及用户组配置,并包含docker-compose的离线部署方法,助力高效完成生产环境搭建。
7905 4
Linux系统离线安装Docker完整指南
vllm+vllm-ascend本地部署QwQ-32B
本指南介绍如何下载、安装和启动基于Ascend的vLLM模型。首先,可通过华为镜像或Hugging Face下载预训练模型;其次,安装vllm-ascend,支持通过基础镜像(如`quay.io/ascend/vllm-ascend:v0.7.3-dev`)或源码编译方式完成;最后,使用OpenAI兼容接口启动模型,例如运行`vllm serve`命令,设置模型路径、并行规模等参数。适用于大模型推理场景,需注意显存需求(如QwQ-32B需70G以上)。
4882 17
|
4月前
|
Linux Android开发 iOS开发
新一代的抓包神器——Reqable
本文介绍全平台抓包工具Reqable,支持Windows、Mac、Linux及Android、iOS,操作简单,无需复杂配置,可轻松抓取HTTP/HTTPS和WebSocket请求,适合开发者快速分析数据,提升调试效率。
2429 0
|
5月前
|
开发工具 开发者 AI芯片
昇腾 Triton-Ascend 开源实战:架构解析、环境搭建与配置速查
本文深度解析Triton-Ascend开源项目,涵盖源码结构、编译流程与环境部署,重点针对Ascend 910B硬件提供从CANN安装到算子开发的保姆级指南,并详解Autotune调优策略与性能分析工具,助力开发者高效构建高性能AI算子。
784 0
|
Kubernetes 调度 开发者
qwen模型 MindIE PD分离部署问题定位
使用MindIE提供的PD分离特性部署qwen2-7B模型,使用k8s拉起容器,参考这个文档进行部署:https://www.hiascend.com/document/detail/zh/mindie/100/mindieservice/servicedev/mindie_service0060.html,1个Prefill,1个Decode。 最后一步测试推理请求的时候,出现报错:model instance has been finalized or not initialized。
734 1
|
12月前
|
人工智能 弹性计算 JSON
MCP进阶:一键批量搞定MCP工具部署
本文介绍了一种基于阿里云计算巢的一站式MCP工具解决方案,解决了传统MCP工具集成中的效率低下、调用方式割裂和动态管理困难等问题。方案通过标准化协议实现多MCP工具批量部署,提高云资源利用率,并支持OpenAPI与MCP双通道调用,使主流AI助手如Dify、Cherry Studio等无缝接入。内容涵盖背景、原理剖析、部署使用实战及问题排查,最后强调MCP协议作为“通用语言”连接数字与物理世界的重要性。
2117 62
MCP进阶:一键批量搞定MCP工具部署
|
11月前
|
前端开发 开发工具 C++
离线推理全流程&模型调优
本指南详细介绍小模型推理方案,涵盖从模型转换到推理的全流程。包括ATC架构转换、ModelZoo-PyTorch指导文档、ONNX导出与优化、离线及在线推理等环节。特别针对Chinese_CLIP模型,提供上机操作指导,如模型支持度分析、onnx-sim简化、msit surgeon优化、AOE自动调优和模型压缩等步骤。
离线推理全流程&模型调优

热门文章

最新文章