linux搭建miniconda+cuda+pytoch深度学习环境

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,5000CU*H 3个月
模型训练 PAI-DLC,5000CU*H 3个月
简介: 本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。

本文以图文结合的方式,详细记录了linux操作系统搭建miniconda+cuda+pytoch深度学习环境的步骤,供大家参考学习。
一、gpu服务器准备
首先注册九天毕昇人工智能平台,注册之后有免费的gpu服务器可以使用,注册后点击右上角的控制台,然后点击单机训练-->新建实例
image.png
image.png
然后对实例名称进行命名,选择资源套餐。
image.png
新建实例之后,点击启动,然后点击jupyter,然后在other选项中选择以terminal。
image.png
二、miniconda安装
进入官网miniconda官网
按照官网的命令进行安装
image.png
1、运行以下命令,创建miniconda3目录,和下载miniconda3
mkdir -p ~/miniconda3
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -O ~/miniconda3/miniconda.sh
image.png
2、运行以下命令,安装miniconda3
bash ~/miniconda3/miniconda.sh -b -u -p ~/miniconda3

image.png
3、运行以下命令,删除miniconda3包
rm -rf ~/miniconda3/miniconda.sh
image.png

4、安装完成后,运行以下命令,初始化终端Shell,以便我们可以直接运行conda。
~/miniconda3/bin/conda init bash
~/miniconda3/bin/conda init zsh
image.png
5、验证
关闭终端,重新打开终端,输入python查看安装的python版本号。
image.png
6、Conda源查看
查看conda下载源,可以看到为阿里云镜像。如果是国外的anaconda地址,建议为国内的源。
运行conda info,查看目前的源
image.png
三、cuda配置
1、运行nvcc --version命令,查看服务器默认的cuda版本
image.png
2、运行echo $PATH命令,查看当前服务器的默认路径,可以看到cuda的默认路径为/usr/local/cuda/bin
image.png
3、运行ls -l /usr/local查看local目录中的详细信息。
image.png
可以看到cuda -> /usr/local/cuda-10.1,这是一个软连接,指向cuda10.1这个目录。
从上面可以看出,服务器中有两个cuda版本(10.1和11.7),服务器默认是10.1,由于10.1相对比较低。
4、下面修改服务器默认cuda版本,更改为cuda-11.7
(1)运行cd /usr/local/命令,进入/usr/local/目录下
(2)运行sudo rm -rf /usr/local/cuda命令,删除原来的软链接
(3)运行sudo ln -s /usr/local/cuda-11.7 /usr/local/cuda命令,生成新的软链接
(4)运行nvcc --version,再次查看cuda版本
image.png
四、pytorch下载安装
1、创建虚拟环境
运行conda create --name d2l python=3.9 -y命令,创建一个新的conda环境,名称叫d2l,虚拟环境安装在目录(/root/.local/conda/envs/ailearn)下
image.png
image.png
2、查看系统中刚才创建的虚拟环境d2l
运行conda info --envs命令可以查看创建的虚拟环境d2l
image.png
3、激活虚拟环境d2l
运行conda activate d2l,激活虚拟环境,准备安装pytorch
image.png
4、安装pytorch1.13.1版本
运行pip install torch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1命令,安装pytorch、torchvision、torchaudio三个包

image.png
5、运行pip list查看虚拟环境中已安装的包
image.png
6、验证pytorch是GPU版本还是cpu版本
image.png
print(torch.cuda.is_available())为true,表示为gpu版本,
print(torch.cuda.device_count())表示查看gpu的数量。
7、查看gpu显存占用和总大小
运行nvidia-smi,可以看到目前显存占用为0,总大小为8000M
image.png

至此,深度学习环境准备完毕。

相关实践学习
部署Stable Diffusion玩转AI绘画(GPU云服务器)
本实验通过在ECS上从零开始部署Stable Diffusion来进行AI绘画创作,开启AIGC盲盒。
目录
相关文章
|
1月前
|
安全 Linux 网络安全
Linux环境中安装和使用Paramiko
Linux环境中安装和使用Paramiko
85 12
|
1月前
|
Java 关系型数据库 MySQL
Linux环境
Linux环境
34 5
|
10天前
|
Web App开发 搜索推荐 Unix
Linux系统之MobaXterm远程连接centos的GNOME桌面环境
【10月更文挑战第21天】Linux系统之MobaXterm远程连接centos的GNOME桌面环境
98 4
Linux系统之MobaXterm远程连接centos的GNOME桌面环境
|
6天前
|
Linux UED iOS开发
|
11天前
|
Ubuntu 应用服务中间件 Linux
Linux下搭建Nginx环境的搭建
Linux下搭建Nginx环境的搭建
|
15天前
|
监控 Linux 云计算
Linux操作系统在云计算环境中的实践与优化###
【10月更文挑战第16天】 本文探讨了Linux操作系统在云计算环境中的应用实践,重点分析了其在稳定性、安全性和高效性方面的优势。通过具体案例,阐述了Linux如何支持虚拟化技术、实现资源高效分配以及与其他开源技术的无缝集成。文章还提供了针对Linux系统在云计算中的优化建议,包括内核参数调整、文件系统选择和性能监控工具的应用,旨在帮助读者更好地理解和应用Linux于云计算场景。 ###
17 3
|
23天前
|
Ubuntu Linux 编译器
Linux/Ubuntu下使用VS Code配置C/C++项目环境调用OpenCV
通过以上步骤,您已经成功在Ubuntu系统下的VS Code中配置了C/C++项目环境,并能够调用OpenCV库进行开发。请确保每一步都按照您的系统实际情况进行适当调整。
198 3
|
2月前
|
机器学习/深度学习 自动驾驶 算法
深度学习之虚拟环境生成
基于深度学习的虚拟环境生成是利用深度学习技术自动创建复杂的三维虚拟场景和环境。这一领域在游戏开发、虚拟现实(VR)、增强现实(AR)、模拟训练等方面有广泛的应用。
42 6
|
19天前
|
机器学习/深度学习 数据挖掘 数据处理
深度学习之卫星图像中的环境监测
基于深度学习的卫星图像环境监测是指通过使用深度学习模型处理和分析来自卫星的遥感数据,以实现对地球环境的自动化监测和分析。这项技术极大提升了环境监测的效率、精度和规模,应用于气候变化研究、生态保护、自然灾害监测、城市扩张评估等多个领域。
48 0
|
2月前
|
Oracle Java 关系型数据库
Linux下JDK环境的配置及 bash: /usr/local/java/bin/java: cannot execute binary file: exec format error问题的解决
如果遇到"exec format error"问题,文章建议先检查Linux操作系统是32位还是64位,并确保安装了与系统匹配的JDK版本。如果系统是64位的,但出现了错误,可能是因为下载了错误的JDK版本。文章提供了一个链接,指向Oracle官网上的JDK 17 Linux版本下载页面,并附有截图说明。
Linux下JDK环境的配置及 bash: /usr/local/java/bin/java: cannot execute binary file: exec format error问题的解决