带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

本文涉及的产品
无影云电脑个人版,1个月黄金款+200核时
无影云电脑企业版,4核8GB 120小时 1个月
资源编排,不限时长
简介: 带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

简介:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高。

背景:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高,这些升级操作在没有完全自动化以前,每次版本升级需要投入的人力都在1-2人月,为了有效降低运维人力投入以及客户侧运维的投入并提升运维升级的效率,为此我们提供了多种vGPU驱动升级方案,本篇主要介绍使用云助手插件自动完成vGPU驱动安装和升级。

适用场景

针对的客户场景主要是云桌面和云游戏等客户,要求使用最新的GRID驱动以适配最新的渲染软件和游戏引擎,同时又需要具备批量自动化的运维方式支持,也同样适用于购买了GPU或者vGPU实例后,需要进行图形加速能力而不知道应该具体安装哪款GRID驱动的用户,只需要通过云助手执行一条指令就可以自动完成GRID驱动的升级或者全新安装,云助手本身支持批量调用。

 

实现原理

image.png

使用方法:

Windows系统:

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

Windows系统执行命令行如下(直接复制粘贴即可)

$InstalledPlugins = $(acs-plugin-manager --list --local)
if ($($InstalledPlugins | Select-String "grid_driver_install"))
   {
     acs-plugin-manager --remove --plugin grid_driver_install
   } 
acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install



6) 执行命令行后,可能会返回两种结果,1是改实例未安装过GRID驱动,进行全新安装,2是该实例已经安装过旧版本的GRID驱动,需要升级安装。区别就是驱动的升级安装是执行2次同样的命令行,系统内部会自动就行逻辑处理,全新安装只需要执行一次命令行。

下图是已经安装过旧版本GRID驱动,需要先卸载旧版本驱动,再安装新版本驱动:

卸载完旧版本驱动之后需要重启一次实例,然后再次执行上面给的命令行进行驱动安装

image.png

下图是全新安装驱动的返回日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,重启实例,然后远程连接实例,桌面右键打开 NVIDIA控制面板

image.png

显示结果如下所示,表示安装的新GRID驱动已生效

image.png

Linux系统

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

 

6) 执行命令行,Linux系统因为卸载驱动和安装驱动可以自动完成,不需要重启实例,所以不管是全新安装还是升级安装,都是只需执行一次命令行即可。

Linux系统执行命令行如下(直接复制粘贴即可)

if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1
then
acs-plugin-manager --remove --plugin grid_driver_install
fi
acs-plugin-manager --exec --plugin grid_driver_install

命令执行之后的日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,然后远程连接实例,执行 nvidia-smi指令,显示结果如下图,表示已成功升级或安装GRID驱动。

image.png

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
相关文章
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——产品功能
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——产品功能自制脑图
149 1
|
7月前
|
弹性计算 Unix Linux
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(1)
130 2
|
7月前
|
弹性计算 并行计算 UED
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
带你读《弹性计算技术指导及场景应用》——4. 自动安装NVIDIA GPU驱动和CUDA组件
152 0
|
7月前
|
弹性计算 Linux 测试技术
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)
带你读《弹性计算技术指导及场景应用》——1. 单实例上运行Linux桌面多开解决方案(2)
145 0
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——配置
阿里云最新产品手册——云基础产品与基础设施——计算——弹性裸金属服务器——配置自制脑图
147 2
|
专有云
阿里云最新产品手册——阿里云核心产品——专有云飞天企业版——产品能力升级
阿里云最新产品手册——阿里云核心产品——专有云飞天企业版——产品能力升级自制脑图
315 1
|
数据中心
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU——CIPU+飞天
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU——CIPU+飞天自制脑图
157 1
《阿里云产品手册2022-2023 版》——磐久服务器
《阿里云产品手册2022-2023 版》——磐久服务器
226 0
《阿里云产品手册2022-2023 版》——磐久服务器
|
数据中心
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU自制脑图
119 1
|
数据中心
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU——CIPU简介
阿里云最新产品手册——阿里云核心产品——云数据中心专用处理器CIPU——CIPU简介自制脑图
230 1