文/龙蜥社区高性能存储 SIG
01 背景介绍
传统的 IO 软件栈已经无法完全释放出高性能存储设备的性能,高性能 IO 栈是当前存储领域重点研究的课题之一,代表性的如用户态方案 SPDK,以及标准的内核态方案 io_uring。
02 关键技术
Linux 社区从零开始设计一种全新的异步 IO 框架 io_uring。io_uring 为了避免在提交和完成事件中的内存拷贝,设计了一对共享的 ring buffer 用于应用程序和内核之间的通信。该设计带来的好处有:
- 提交、完成请求时无需应用和内核之间的内存拷贝。
- 使用 SQPOLL 高级特性时,应用程序无需系统调用。
- 无锁操作,用 Memory Ordering 实现同步等。
龙蜥社区自 2020 年上半年开始参与 io_uring 社区开发,贡献了多个特性和优化,并在图数据库场景探索容器化部署和针对性优化。
技术优势:应用程序通过统一的标准系统调用来使用 io_uring。相比传统的 Linux Native AIO,io_uring 消除了仅支持 Direct IO 的限制以及额外的内存拷贝开销;相比用户态框架SPDK,io_uring 可复用 Linux 内核的标准驱动,无需额外的用户态驱动开发,应用场景更通用,编程接口更友好。
该技术特点包括:
- 简单易用,方便应用集成。
- 可扩展,不仅仅为存储 IO 使用,同样可以用于网络 IO。
- 特性丰富,满足所有应用,如支持 Buffer IO。
- 高效,尤其是针对大部分 512 字节或 4K IO 场景。
- 可伸缩,满足峰值场景的性能需要等。
应用场景:io_uring 可适用于绝大多数对异步 IO 有诉求的业务和应用。目前,io_uring 已在多个主流开源应用中集成,如 RocksDB、Netty、QEMU、SPDK、PostgreSQL、MariaDB 等。
03 图数据库引擎 iGraph 优化实践
图计算服务 Graph Compute 是龙蜥社区理事长单位阿里云研发的高性能分布式图计算产品,支持复杂图关系数据的存储、查询和计算,高效对接图算法与模型,在搜索推荐广告、实时风控、知识图谱、社交网络等场景有着广泛的应用。其内核引擎 iGraph 在基于磁盘的查询访问场景下引入了 io_uring,支持高 IOPS 下稳定运行。
实践效果:图数据库引擎 iGraph 经过 io_uring 适配优化后,线上运行环境在 CPU 开销不高于原始使用 Linux Native AIO 版本的前提下,业务端到端时延优化达 20%。
更多龙蜥白皮书精选内容:
【4】龙蜥全面支持 Intel 第四代可扩展处理器 SPR 平台
相关链接:
高性能存储 SIG 主页:https://openanolis.cn/sig/high-perf-storage
更多龙蜥技术特性解析可移步《龙蜥特性百科》:
https://anolis.gitee.io/anolis_features/
2022 龙蜥社区全景白皮书(或公众号【OpenAnolis龙蜥】回复关键字“白皮书”获取)
https://openanolis.cn/openanoliswhitepaper
—— 完 ——
加入龙蜥社群
加入微信群:添加社区助理-龙蜥社区小龙(微信:openanolis_assis),备注【龙蜥】与你同在;加入钉钉群:扫描下方钉钉群二维码。