带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

简介: 带你读《弹性计算技术指导及场景应用》——3. vGPU驱动自动安装和升级

简介:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高。

背景:为了适配最新的渲染软件,以及驱动稳定性的提升,vGPU实例的驱动需要定期进行升级,因为使用vgpu的客户多数为渲染和云游戏等业务场景,对vGPU驱动的快速升级和批量自动化要求比较高,这些升级操作在没有完全自动化以前,每次版本升级需要投入的人力都在1-2人月,为了有效降低运维人力投入以及客户侧运维的投入并提升运维升级的效率,为此我们提供了多种vGPU驱动升级方案,本篇主要介绍使用云助手插件自动完成vGPU驱动安装和升级。

适用场景

针对的客户场景主要是云桌面和云游戏等客户,要求使用最新的GRID驱动以适配最新的渲染软件和游戏引擎,同时又需要具备批量自动化的运维方式支持,也同样适用于购买了GPU或者vGPU实例后,需要进行图形加速能力而不知道应该具体安装哪款GRID驱动的用户,只需要通过云助手执行一条指令就可以自动完成GRID驱动的升级或者全新安装,云助手本身支持批量调用。

 

实现原理

image.png

使用方法:

Windows系统:

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

Windows系统执行命令行如下(直接复制粘贴即可)

$InstalledPlugins = $(acs-plugin-manager --list --local)
if ($($InstalledPlugins | Select-String "grid_driver_install"))
   {
     acs-plugin-manager --remove --plugin grid_driver_install
   } 
acs-plugin-manager --fetchTimeout 0 --exec --plugin grid_driver_install



6) 执行命令行后,可能会返回两种结果,1是改实例未安装过GRID驱动,进行全新安装,2是该实例已经安装过旧版本的GRID驱动,需要升级安装。区别就是驱动的升级安装是执行2次同样的命令行,系统内部会自动就行逻辑处理,全新安装只需要执行一次命令行。

下图是已经安装过旧版本GRID驱动,需要先卸载旧版本驱动,再安装新版本驱动:

卸载完旧版本驱动之后需要重启一次实例,然后再次执行上面给的命令行进行驱动安装

image.png

下图是全新安装驱动的返回日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,重启实例,然后远程连接实例,桌面右键打开 NVIDIA控制面板

image.png

显示结果如下所示,表示安装的新GRID驱动已生效

image.png

Linux系统

1)登录ECS管理控制台

2)在左侧导航栏,选择运维与监控 > 发送命令/文件(云助手)。

3)在页面左侧顶部,选择目标资源所在的地域。

image.png

4)在ECS实例页签下的实例列表,选择目标实例,单击对应操作栏下的执行命令。

image.png

5)通过创建并执行云助手命令来升级或安装GRID驱动。

image.png

 

6) 执行命令行,Linux系统因为卸载驱动和安装驱动可以自动完成,不需要重启实例,所以不管是全新安装还是升级安装,都是只需执行一次命令行即可。

Linux系统执行命令行如下(直接复制粘贴即可)

if acs-plugin-manager --list --local | grep grid_driver_install > /dev/null 2>&1
then
acs-plugin-manager --remove --plugin grid_driver_install
fi
acs-plugin-manager --exec --plugin grid_driver_install

命令执行之后的日志截图:

image.png

7)验证升级或安装的GRID驱动是否生效

安装完成后,然后远程连接实例,执行 nvidia-smi指令,显示结果如下图,表示已成功升级或安装GRID驱动。

image.png

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
机器学习/深度学习 负载均衡 Java
【SpringBoot系列】微服务远程调用Open Feign深度学习
【4月更文挑战第9天】微服务远程调度open Feign 框架学习
782 2
|
存储 缓存 测试技术
ZYNQ-AXI Interconnect IP介绍
ZYNQ-AXI Interconnect IP介绍
3141 0
ZYNQ-AXI Interconnect IP介绍
|
Java 关系型数据库 MySQL
IDEA(Community版)数据库插件Database Navigator的安装与使用教程
IDEA(Community版)数据库插件Database Navigator的安装与使用教程
IDEA(Community版)数据库插件Database Navigator的安装与使用教程
|
10月前
|
缓存 前端开发 安全
网站显示不安全的解决办法
当浏览器提示网站“不安全”时,通常是HTTPS配置或证书问题。解决方法包括:检查网址、验证证书状态(是否失效、域名匹配、CA受信任),确保证书链完整,避免自签名证书;解决混合内容问题,确保所有资源使用HTTPS;修正服务器配置,强制HTTP跳转HTTPS,启用TLS 1.2/1.3,添加HSTS;检查本地时间与浏览器缓存。按此步骤排查,可有效解决问题。
|
7月前
|
Web App开发 前端开发 JavaScript
鸿蒙5开发宝藏案例分享---Web适配一多开发实践
这是一份实用的鸿蒙Web多设备适配开发指南,针对开发者在不同屏幕尺寸下的布局难题提供了解决方案。文章通过三大法宝(相对单位、媒体查询和窗口监听)详细介绍如何实现智能适配,并提供了多个实战案例,如宫格布局、对话框变形和自适应轮播图等。此外,还分享了调试技巧及工具推荐,帮助开发者快速上手并优化性能。最后鼓励读者实践探索,并提示更多官方资源等待发现。
|
存储 内存技术
内存条RAM详细指南
内存条(RAM)是电脑中用于临时存储数据和程序的部件,CPU依赖它执行操作。内存条经历了从主内存扩展到读写内存整体的发展,常见类型包括SDRAM和DDR SDRAM。内存容量、存取时间和奇偶校验是衡量其性能的关键指标。在选购时,应考虑类型、容量、速度和品牌,知名品牌的内存条提供更好的可靠性和稳定性。
5097 2
|
SQL 缓存 安全
深入解析MyBatis-Plus LambdaQueryWrapper与QueryWrapper:高效数据查询的秘密
深入解析MyBatis-Plus LambdaQueryWrapper与QueryWrapper:高效数据查询的秘密
14230 2
|
监控 安全 Unix
在Linux中,如何进行安全漏洞扫描?
在Linux中,如何进行安全漏洞扫描?
|
关系型数据库 MySQL Linux
在CentOs7虚拟机Linux离线安装mysql5.6(亲测可用)
该博客文章详细记录了在CentOS 7虚拟机上离线安装MySQL 5.6版本的完整过程,包括下载安装包、导入虚拟机、卸载MariaDB、配置文件设置、服务启动和权限配置等步骤。
在CentOs7虚拟机Linux离线安装mysql5.6(亲测可用)
|
Web App开发 Python
Selenium Python 更改 chrome 默认下载目录
关于使用Selenium和Python无法更改Google Chrome默认下载目录的可能问题和解决方法,按照以上步骤,你应该能够成功使用Selenium和Python更改Google Chrome的默认下载目录。
646 0

热门文章

最新文章