AI场景下的对象存储OSS数据管理实践

本文涉及的产品
对象存储 OSS,20GB 3个月
数据管理 DMS,安全协同 3个实例 3个月
推荐场景:
学生管理系统数据库
对象存储 OSS,内容安全 1000次 1年
简介: 本文介绍了ECS和OSS的操作流程,分为两大部分。第一部分详细讲解了ECS的登录、密码重置、安全组设置及OSSUTIL工具的安装与配置,通过实验创建并管理存储桶,上传下载文件,确保资源及时释放。第二部分则聚焦于OSSFS工具的应用,演示如何将对象存储挂载为磁盘,进行大文件加载与模型训练,强调环境搭建(如Conda环境)及依赖安装步骤,确保实验结束后正确清理AccessKey和相关资源。整个过程注重操作细节与安全性,帮助用户高效利用云资源完成实验任务。

主要内容

一、第一部分实操与解说

二、第二部分实操与解说

 

一、第一部分实操与解说 

登录ECS需要注意,ECS开始没有设置密码,登录ecs第一步需要手动设置密码,在实验手册中有完整操作流程,可以登录ECS详细页仔细浏览。该环节是重置ECS密码第一个环节,通过ECS云服务器左边产品手册,下方资源页签,云服务器中的管理可以进入ECS管理页面,可以在该页面右方界面进行操作与选择,选择重置密码,会弹出框,在该框架中设置自己的密码,可以选择在线重置,避免重复。

image.png

输入密码后,在下方有安全组管理,而有一些情况需要设置安全组,在本人账号有默认安全组,同时有授予权限,可以不用设置,根据个人情况而定。

在安全组中要把IP地址加入到允许的列表。在手册里,它有一个本机IP地址链接,可直接使用。

image.png

image.png

 

image.png

点进去后,会暴露公网VIP,可以直接使用。选择快速添加,把端口号2280443加入。下一步申请实验所使用的AccessKey,实验完,会释放资源,之前的也会释放掉,是一个临时的AccessKey。

image.png

 

image.png

 

由于乱序,再重复演示一遍。

image.png


首先添加AccessKey,选择下载csv文件,把AccessKey保存到本地,方便后续使用。登录ECS,下载和安装OSSUTIL工具。输入设置得ESC密码,登录到ECS页面。

image.png


y可以直接复制手册中的地址。第一步安装解压软件,先下载一个依赖软件包,接下来安装OSSUTIL,安装完毕后进行ossutil配置。选择回车,这里会要求填AccessKey。之后需要填写alntPoint,这些在云资源页面oss系统已经列出,只需填内网域名,OSSUTIL配置完毕。现在执行并观察参数,所有数据都可视,oss所有功能都可以通过OSSUTIL进行执行。


在创建实验桶下面,实验桶名需要填写资源中的Bucketname。 image.png

image.png

image.png

观察资源页签,可以把刚刚创建的统一复制过来。创建本地文件,通过ossutil进行上传。观察发现,文件上传完成后,存在两条目录,第一个是文件,对象存储没有文件夹概念,它采用带左斜线文件来模拟文件夹,在其他系统中检测到各种带斜线文件会优先把它识别为目录,OSS里目录模拟过程相同。


创建本地目录,把文件下载,在做完实验后把access key释放掉。其中实验流程比较短,先安装工具,再上传下载和access key释放。最后实验结束把资源释放就结束了。 image.png


删除access key时要确认输入access key。关于资源删除部分,需要注意结束时间时,有两个选项,默认会把资源释放掉。

image.png


需要选择市场资源,把所有资源全部释放完,应选右边,失误选到左边,会持续扣费。这就是整个实验操作。

 

二、第二部分实操与解说

 

介绍关于OSSFS设备,即把一个桶化为一个盘的工具。

image.png


首先开始申请资源,需要花费几分钟进行等待。资源创建完成后,可以在最左侧云产品资源标签中,看到所有自动开通场景跟资源实例。如果采用新的云起场景体验,在结束后,不管是手动还是自动,都会自动默认释放资源。手动也可以选择释放资源,都不会产生额外费用。根据左侧实验手册继续进行下一步,首先进行安全设置,设置ECS密码和安全处,操作流程一样。


在ECS服务器管理页面,在右边全部操作里找到重置密码并输入密码,进行登录尝试。登录成功即可进行下一步。

image.png

现在申请access key。因为刚才实验access key作废,需要再申请一次,跟刚才流程一样。会有手机短信验证进行安全验证的弹窗出现,在做过类似操作验证后,过一段时间内不会存在安全验证,需把access key保存。


在对象存储控制台上传文件,观察ossfs是否可查看到文件。点击左边资源页面,OSS管理,进到创建桶的管理页面。左边可选择文件列表,里面内容为空,可以随便找一个文件上传。扫描文件,选择一个上传,就完成了。此时文件列表在OSS设置中显示已经有一个文件。下一步进行OSS FS工具安装。登录ECS服务器,相关安装命令在手册中,可以直接复制下来使用。运行过程中需要确认是否安装,遇到这种情况,按照提示选择no或者yes。

image.png


这种情况下,直接选择ok。安装完成观察版本为1.91.3,是当前最新版本。接下来配置OSSFS,首先复制左边操作手册里面命令。

image.png


有几个参数需要填,分别是deckname、access key ID、access key secret.,将文件导出并复制。可以在资源页签里找到。

image.png

现在创建挂载目录,把ossfs挂载到目录下,有几个参数与刚刚下载的参数一致。将参数挂载至文件夹,第三个参数是对象存储alntpoint,在里面需要填内网域名。下一个参数是在OLIWET,还有一个参数表示预取数据。最后是o direct track set。

image.png


其他一些参数在阿里云官网ossfs手册中,方便展示,选取了连续大块顺序读取情况。有一些是小范围随机oss读出来的情况,在内容混合、OS混合读取模式以及读取模式里一些参数会有优化,但没有继续展示,操作流程太多,仔细浏览手册即可。

image.png


挂载完成,上传一个本地文件,通过写入盘方式上传到oss,它会直接在本地创造一个文件,并通过CUT模式下载。


下面进行输出时间,后面会尝试加载模型文件,可以在社区寻找。本次示范选择的是checkpoint模型文件,内存在5g左右,内存下载会需要一些时间,一般在六、七分钟左右,并且这里的上传下载都是需要等待的。模型下载完后,需要验证模型加载情况,下载后,先把它上传到地方存储,通过命令,把模型放到这去处理,此处需要时间去等待。下载完成后,可以发现目录已经有文件。接下来以pytorch形式来加载模型,需要提前安装必备工具。依旧点击OK。


下载包,以conda方式运行该脚本,安装脚本,点击回车,它会往下面刷新一直刷到确认协议地。

image.png

出来就选yes。点回车确认,它会自动安装。最后一步让确认验收任务,选yes,此时装置安装完成,版本是24.5.0。Conda完成后,通过Conda创建实验环境,名字先叫做麦延威


开始创建环境的依赖。环境创建完成后进行激活。在左边小括号中是自己创建的环境。接下来安装pytorch。确认时选yes。这里主要运用到的是conda软件。该软件实际上是帮助准备pip环境,conda可以帮pip做区分和隔离,conda可以做版本软件包的管理,用起来会比较方便,此次示范主要是通过conda创建自己的实验环境,以及通过conda的软件管理来安装pytorch。


image.png


现在依赖安装完毕。它实际上利用的是pytorch中today函数来加载模型,ossfs在加载连续大文件中,脚本还会打印出整体的耗时。

image.png


同时,在加载时,可以再开一个窗口,窗口中可以看到右边网络包带宽情况,也可以看到峰值流量差不多是600兆。在其它模型文件中,io模式跟CTP可能不同,io模式需要大家在实际实验中去微调阅读参数,像上面的实验,把整个模型上传加载,在实验做完后释放Accesskey和实验资源,就跟刚才的最后一波流程是一样的。

image.png


Accesskey可以每次都删除,来确保安全有效。如果之后不需要保留,需要选择释放资源。

相关实践学习
MySQL基础-学生管理系统数据库设计
本场景介绍如何使用DMS工具连接RDS,并使用DMS图形化工具创建数据库表。
相关文章
|
19天前
|
存储 人工智能 运维
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
132 47
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
|
17天前
|
消息中间件 人工智能 运维
1月更文特别场——寻找用云高手,分享云&AI实践
我们寻找你,用云高手,欢迎分享你的真知灼见!
980 46
1月更文特别场——寻找用云高手,分享云&AI实践
|
18天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
121 23
|
13天前
|
存储 人工智能 NoSQL
Tablestore深度解析:面向AI场景的结构化数据存储最佳实践
《Tablestore深度解析:面向AI场景的结构化数据存储最佳实践》由阿里云专家团队分享,涵盖Tablestore十年发展历程、AI时代多模态数据存储需求、VCU模式优化、向量检索发布及客户最佳实践等内容。Tablestore支持大规模在线数据存储,提供高性价比、高性能和高可用性,特别针对AI场景进行优化,满足结构化与非结构化数据的统一存储和高效检索需求。通过多元化索引和Serverless弹性VCU模式,助力企业实现低成本、灵活扩展的数据管理方案。
47 12
|
8天前
|
机器学习/深度学习 存储 人工智能
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
33 5
|
13天前
|
存储 人工智能 缓存
面向AI的存储软硬结合实践和创新
本次分享的主题是面向AI的存储软硬结合实践和创新,由阿里云智能集团专家袁茂军、王正勇和常存银主讲。内容涵盖三大板块:自研存储部件设计及实践、自研存储服务器设计及实践、以及面向AI场景的存储软硬一体解决方案及实践。重点介绍AliFlash系列存储部件的演进与优化,包括QLC SSD的设计挑战与解决方案,并探讨了高性能存储服务器在AI场景中的应用与未来发展方向。通过软硬件深度融合,旨在提升AI业务的性能与效率,降低总拥有成本(TCO)。
|
13天前
|
存储 人工智能 边缘计算
AI时代下, 边缘云上的技术演进与场景创新
本文介绍了AI时代下边缘云的技术演进与场景创新。主要内容分为三部分:一是边缘云算力形态的多元化演进,强调阿里云边缘节点服务(ENS)在全球600多个节点的部署,提供低时延、本地化和小型化的价值;二是边缘AI推理的创新发展与实践,涵盖低时延、资源广分布、本地化及弹性需求等优势;三是云游戏在边缘承载的技术演进,探讨云游戏对边缘计算的依赖及其技术方案,如多开技术、云存储和网络架构优化,以提升用户体验并降低成本。文章展示了边缘云在未来智能化、实时化解决方案中的重要性。
|
14天前
|
人工智能 缓存 安全
每一个大模型应用都需要一个 AI 网关|场景和能力
本次分享的主题是每一个大模型应用都需要一个 AI 网关|场景和能力。由 API 网关产品经理张裕(子丑)进行分享。主要分为三个部分: 1. 企业应用 AI 场景面临的挑战 2. AI 网关的产品方案 3. AI 网关的场景演示
|
14天前
|
存储 Serverless 文件存储
AI 场景下,函数计算 GPU 实例模型存储最佳实践
当前,函数计算 FC 已被广泛应用在各种 AI 场景下,函数计算支持通过使用容器镜像部署 AI 推理应用,并且提供多种选项来访问训练好的模型。为了帮助开发者高效地在函数计算上部署 AI 推理应用,并快速解决不同场景下的模型存储选型问题,本文将对函数计算的 GPU 模型存储的优缺点及适用场景进行对比分析,以期为您的模型存储决策提供帮助。
|
24天前
|
人工智能 自然语言处理 Java
Spring Cloud Alibaba AI 入门与实践
本文将介绍 Spring Cloud Alibaba AI 的基本概念、主要特性和功能,并演示如何完成一个在线聊天和在线画图的 AI 应用。
253 7