阿里云自研存储部件创新亮相2024全球闪存峰会

简介: 阿里云在AI时代背景下对自研存储部件进行的一系列创新实践并取得丰硕成果。

【阅读原文】戳:阿里云自研存储部件创新亮相2024全球闪存峰会

8月28日,“2024全球闪存峰会(FMW)”在南京盛大开幕,本次峰会的主题是“芯存储 AI未来”。会议聚焦于高端存储、企业级SSD、AIGC存储、CXL技术以及行业应用等多个前沿领域。众多来自国内外的知名科技企业代表、业界顶尖专家和学者齐聚一堂,共同探讨闪存技术的最新应用现状、面临的挑战,并寻找合作发展的新机遇。

 

阿里云服务器研发团队受邀参与此次盛会,并发表了题为“阿里云面向AI时代的自研存储部件创新与实践”的演讲。该演讲全面展示了阿里云在AI时代背景下,对自研存储部件进行的一系列创新实践与取得的成果。

 

图丨坤合演讲现场照片

 

自2016年以来,阿里云便开始了自研存储部件的研发之路,推出了首款产品Aliflash V1,并在此后不断迭代更新。目前,最新的产品线已经涵盖Aliflash V5 SSD和AliSCM V1持久化内存两大系列核心产品。

 

在Aliflash和AliSCM的发展过程中,阿里云采取了明确的发展策略与业务目标。首先,在性能方面,通过对接口、介质和算法等关键技术的创新,确保了产品在行业内处于领先地位。其次,在成本控制上,通过支持低成本介质、ZNS以及透明压缩等方式,有效降低了业务TCO,创造了更高的业务价值。再者,通过建立全面的测试验证体系及采用先进的运维管理手段,显著提高了产品的稳定性和可靠性。最后,通过与业务部门的深度软硬件整合,针对性地解决业务的痛点问题并满足定制化需求,进一步提升了阿里云各项业务的核心竞争力。

 

目前Aliflash SSD系列与AliSCM持久化内存的各代次产品均已成功在多个业务场景中落地应用,并取得了良好的效果,目前正处于规模上线或灰度测试阶段,切实地为业务创造更好价值。其中自研透明压缩盘更是通过4倍压缩比、租户压缩率上报和租户加解密等能力加持,更深入的帮助业务降低成本提升竞争力。未来,阿里云将持续在Aliflash和AliSCM等自研存储部件上探索CXL、PIM等技术创新,深化AI领域的研究与实践。

 

面对AI大模型应用爆发对基础设施的极致要求,阿里云还以磐久存储服务器平台为基础,持续推动软硬结合实践和创新,为AI时代数据存储提供核心竞争力。磐久高性能存储服务器平台,通过自研网卡实现高性能、低延迟400G网络,支持大规模训练集群高速数据传输。磐久大容量存储服务器平台,规模落地大容量SMR HDD,提供极致成本的AI数据集存储服务。磐久智算存储服务器平台,与业务紧密合作,基于自研硬件平台完成了数据集智能流动、数据集加速及CheckPoint流程优化提效等关键功能开发上线。

 

阿里云自研存储部件和服务器平台始终坚持以技术创新为核心驱动力,引领行业发展趋势,与业务紧密软硬融合,为阿里云的持续发展创造独特价值。


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~

相关文章
|
人工智能 固态存储 安全
一文告诉你CXL是什么,有什么新的机会 (上)
> 1. 大数据AI/ML应用爆发驱动大内存需求,但内存增长受限,CXL互联方案应运而生 > 2. CXL分为1.0/2.0/3.0版本,分别提供直连、池化、Fabric能力,预计在2022年/203年/2025年之后市场可用,目前看来池化对于软件的影响最大 > 3. CXL更多是对于已有架构的性能优化,全新的机会不多,较大的机会在于系统软件、内存即服务,以及内存数据库和内存云结构 > 4. CXL大概率将成为跨计算引擎的内存结构标准,短期利好云厂商,长期会数据中心架构产生结构性的变革
4238 0
|
9月前
|
关系型数据库 分布式数据库 数据库
|
存储 固态存储 Linux
BLOCK 层这么多参数都是什么意思?!
每个 request queue 会维护一个 struct queue_limits 结构来描述对应的块设备的硬件参数,这些参数描述了硬件存储单元的组织方式,会影响 block layer 的很多行为,其中部分参数在 `/sys/block//queue/` 下导出 ```c struct request_queue { struct queue_limits limits; ... } `
4907 1
|
存储 人工智能 缓存
面向AI的存储软硬结合实践和创新
本次分享的主题是面向AI的存储软硬结合实践和创新,由阿里云智能集团专家袁茂军、王正勇和常存银主讲。内容涵盖三大板块:自研存储部件设计及实践、自研存储服务器设计及实践、以及面向AI场景的存储软硬一体解决方案及实践。重点介绍AliFlash系列存储部件的演进与优化,包括QLC SSD的设计挑战与解决方案,并探讨了高性能存储服务器在AI场景中的应用与未来发展方向。通过软硬件深度融合,旨在提升AI业务的性能与效率,降低总拥有成本(TCO)。
948 7
|
存储 关系型数据库 分布式数据库
|
消息中间件 存储 负载均衡
AI 推理场景的痛点和解决方案
一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景,解决相关问题,本文我们会针对每个场景逐一说明。
2845 148
AI 推理场景的痛点和解决方案
|
9月前
|
关系型数据库 分布式数据库 数据库
阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
阿里云PolarDB凭借全球首创基于CXL Switch的分布式内存池技术,在SIGMOD 2025上荣获工业赛道“最佳论文奖”,连续两年蝉联该顶会最高奖项。其创新架构PolarCXLMem打破传统RDMA技术瓶颈,性能提升2.1倍,并已落地应用于内存池化场景,推动大模型推理与多模态存储发展,展现CXL Switch在高速互联中的巨大潜力。
阿里云PolarDB数据库蝉联SIGMOD最佳论文奖
|
存储 缓存 人工智能
阿里云Tair KVCache:打造以缓存为中心的大模型Token超级工厂
Tair KVCache 是阿里云推出的面向大语言模型推理场景的缓存加速服务,基于分布式内存池化和分级缓存体系,解决显存墙与带宽瓶颈问题。为万亿参数模型的高效推理提供技术保障,推动 AI 算力进化与规模化应用。
|
关系型数据库 分布式数据库 数据库
云栖大会|从数据到决策:AI时代数据库如何实现高效数据管理?
在2024云栖大会「海量数据的高效存储与管理」专场,阿里云瑶池讲师团携手AMD、FunPlus、太美医疗科技、中石化、平安科技以及小赢科技、迅雷集团的资深技术专家深入分享了阿里云在OLTP方向的最新技术进展和行业最佳实践。