RISC-V 基金会 Data Center SIG 第七次会议圆满结束,研讨硬件加速机制

简介: 围绕“为何需要 TG、要做哪些规范工作、如何证明可行(PoC)以及如何组织生态协作”等关键点展开讨论。

一直以来,龙蜥社区在 RISC-V 生态建设中持续投入,并积极贡献上游社区。RISC-V International Data Center SIG 第七次会议内容见下:

RISC-V IOMMU 的 G-Stage Dirty Log 硬件加速机制提案

近期,RISC-V 基金会 Data Center SIG 月度会议于线上召开,本次会议邀请阿里巴巴达摩院郭任进行分享。会议由阿里巴巴宋卓主持。会议按惯例完成社区协作、反垄断与出口管制等合规提示后,进入本次核心议题:阿里巴巴达摩院郭任分享一项面向 RISC-V IOMMU 的 G-Stage Dirty Log 硬件加速机制提案,并与 RISC-V International 的 Rafael Sene 就后续以任务组(TG)方式推进达成初步共识。

从 CPU 到 IOMMU:Dirty Log 加速要做“系统级闭环”

郭任介绍,Dirty Log 是云数据中心虚拟机 Live Migration(热迁移) 的基础能力之一,主要服务于迁移过程中的 pre-copy 阶段:在虚机仍运行于源端时,需要持续识别并传输“被写脏”的页,避免频繁陷入软件开销大的页故障处理,从而显著提升迁移效率。


他指出,业界在 CPU 侧已有成熟的硬件加速路径(如部分架构提供的脏页记录能力),但在 Shared Guest Phyiscal Address(SGPA) 场景,虚机直通设备(pass-through DMA)可能复用 CPU 页表:即便 CPU 启用了 Dirty Log 加速,设备 DMA 产生的脏写也会让“仅 CPU 侧加速”变得不完整,导致系统层面仍无法正确/高效地收集脏页信息。

因此,本次提案的关键结论是:要让 Dirty Log 真正在云上“跑起来”,必须引入 IOMMU Dirty Log,与 CPU 侧机制协同,实现面向设备 DMA 场景的 系统级 Dirty Log 硬件加速闭环。

方案核心:基于 Ping-Pong Buffer 的“低成本不丢失”记录机制

在实现路径上,郭任重点介绍了本提案区别于其他思路(例如 PRI 机制)的设计取舍:本方案采用 Ping-Pong Buffer 结构,目标是在硬件成本更可控的前提下,避免记录窗口切换时漏记脏页。

  • 双缓冲对(A/B):当 A 缓冲对写满后自动切换到 B 持续记录,软件侧再异步拷出并清空 A;随后反向切换,实现“你写我清、轮转不断档”。
  • 两类并行记录:每个缓冲对内部包含两类同步 buffer:
  • 记录被写脏的 GPA(Guest Physical Address);
  • 记录与该 GPA 对应的 IOHGATP(用于区分其所属 G-stage 地址空间/虚机上下文)。通过同一索引对齐,软件可恢复“哪个虚机/哪个上下文的哪个 GPA 被写脏”。

与会嘉宾反馈 Ping-Pong Buffer 结构不够灵活,需要改进,作者接受建议,并会在新版本中改进。

规范接口草案:能力位、控制/状态寄存器、缓冲区基址与中断事件

郭任进一步给出面向 RISC-V IOMMU 的接口草案轮廓(当前为 v2):

  • 在 capability register 中增加能力位,标识支持 G-stage dirty log。
  • 引入 G-Stage Dirty Log Control Register(GDLCR):包含 enable、buffer size(按 entries 数量阶数配置)等字段。
  • 引入 G-Stage Dirty Log Status Register(GDLSR):提供当前活动缓冲对选择位(A/B)、A/B 满标志(并支持写 1 清除以便原子化处理)、以及当前活动缓冲 tail index 等。
  • 定义两组缓冲区基址寄存器:GPA buffer A/B 与 IOHGATP buffer A/B(均以 PPN 形式给出基址)。
  • 定义四类典型事件/中断:
  • A/B 缓冲对写满触发中断,提示软件拷出并清空;
  • 缓冲指针配置错误等异常;
  • 记录过程中的数据损坏类错误;
  • A、B 同时写满导致“脏页记录失效/丢失”,提示需要回退到全量扫描等恢复策略

推进方式讨论:不走 fast track,拟以新 TG 汇聚多项“共享队列”相关扩展

RISC-V International 的 Rafael Sene 在会上询问该提案后续将以 fast track 还是 TG/TSC 推进。郭任明确表示更倾向成立 TG,并给出了更大的组织化规划:拟筹备一个名为 “Device Shared Work Queue” 的任务组,将多项相互关联的扩展放在同一 TG 生命周期内统筹讨论与推进,包括:

  • AIOE(用于共享硬件工作队列的基础入队能力)
  • IOMMU GIPC(用于共享队列虚拟化/隔离等配套能力)
  • IOMMU Dirty Log(用于共享队列与直通 DMA 场景下的 Live Migration 加速能力)

郭任补充说明:相较 dedicated work queue,共享 work queue 在迁移与资源调度上更具优势,但也更依赖 IOMMU 与虚拟化能力协同,因此希望以“场景驱动”的 TG 方式打包推进。

Rafael 对该思路表示认可,并指出一个重要信号:来自基金会董事会层面的方向中,2026 年的重点之一是云环境能力建设,而 Live Migration 是云的关键组成部分;因此该 TG 方向与组织目标高度一致,有望获得更积极的关注与推进动力。

社区反馈:面向迁移的价值明确,期待继续在邮件列表推进

字节跳动崔运辉在会上表示该方案“对迁移很有用”,总体认可提案方向。郭任也回应希望与字节跳动等社区伙伴进一步协作,结合双方在 CPU/IOMMU dirty log 方向的经验共同完善方案。

会议最后,宋卓总结:后续讨论将继续在邮件列表推进;郭任将依据模板完善 TG 页面与 Proposal for Work,在准备就绪后择机提交 TSC 评审。会议在感谢 Rafael 支持后结束。

Device Shared Work Queue TG 推进讨论

RISC-V International Data Center SIG 召开线上双周例会。本次会议由郭任主要分享和成员共同评审并完善 Device Shared Work Queue(DSWQ)任务组(TG)Proposal for Work 文档,围绕“为何需要 TG、要做哪些规范工作、如何证明可行(PoC)以及如何组织生态协作”等关键点展开讨论。来自字节跳动、中兴通讯以及 RISC-V International 的多位代表参与交流,包括 Rafael Sene、Isaac Chute 等。

从“共享队列”出发:DSWQ 为什么成为数据中心未来技术方向?

郭任在文档讲解中首先明确 TG 使命:为 RISC-V 构建支持 Device Shared Work Queue(设备共享工作队列)的规范体系,使其能够基于“可延迟写(deferable/deliverable write)事务”与 PASID/PID 等机制,实现面向异构设备的高密度 I/O 虚拟化与可迁移能力。

他对比了两类主流队列范式:

  • DWQ(Dedicated Work Queue,专用队列):典型形态为 SQ/CQ 队列对,位于主机内存,由设备拉取/更新;在云环境中往往“一个队列服务一个地址空间”,当 VM/进程密度极高时,需要成百上千甚至更多队列对支撑,成本与复杂度迅速上升。
  • DSWQ(Device Shared Work Queue,设备共享队列):通过设备侧固定宽度 I/O 端口接收来自主机的“可延迟写”命令提交,可在设计上覆盖海量地址空间(文档提到可扩展到百万级),更契合云数据中心的多租户与高密度 I/O 虚拟化需求。

郭任强调,DSWQ 已在多种互连标准与主流架构中形成趋势:包括 PCIe/CXL 等互连语义演进(会议中将其与 PCIe 的 DMWR 等术语类比)以及 x86/Arm 等体系结构已有对应指令/机制。基于此,他认为“RISC-V 没有理由不跟进该方向”,应尽快通过 TG 形成系统化规范与配套生态。

“现有扩展为何不够”:ISA 与 IOMMU 两侧缺口同时存在

在“Why existing extensions are insufficient”章节中,郭任给出两类主要缺口:

  • ISA(架构指令层)缺口
    RISC-V 当前缺少“向 DSWQ 入队命令”的标准化机制。对标业界,x86 有类似 ENQCMD 的能力、Arm 也有相应指令形态;同时还涉及 PASID/PID 的使用与映射/陷入处理机制(虚拟 PASID 到真实 PASID 的管理)。
  • Non-ISA(以 IOMMU/虚拟化为核心)缺口
    现有 IOMMU 机制在 G-stage/进程上下文等方面仍不足以支撑“跨 VM 共享队列”的关键诉求(会议中以 PACID/PASID/PID 相关能力衔接为背景进行说明)。
    进一步地,为提升云上热迁移效率,IOMMU 侧还需要与系统级能力协同(例如前序会议已讨论过的 IOMMU Dirty Log 方向),否则 DSWQ 在 Live Migration 场景下的优势无法充分释放。

TG 目标拆解:三项扩展 + 一揽子生态/PoC 与测试计划

在“Objectives”章节中,郭任将 TG 的拟交付内容拆解为三条主线(并强调它们相互依赖、应在同一 TG 内整体推进):

  • AIOE(Atomic I/O Enqueue):面向 DSWQ 的基础能力,定义指令与 CSR 等机制,解决“如何把命令可靠入队到设备共享队列”的问题。
  • IOMMU GIPC(将 I/O 相关 G-stage 机制下沉到 Process Context):用于更好地支撑 AIOE/DSWQ 在虚拟化与隔离场景中的落地。
  • RISC-V IOMMU Dirty Log:面向 Live Migration,提升共享队列相关 I/O 路径下的迁移效率,并与 CPU 侧能力形成协同。

同时,郭任也在文档中加入“软件生态”视角的内容,用于保障规范不是“纸面设计”,而是可实现、可验证、可被社区复用,包括:VFIO/IOMMU(host/guest)、Linux PASID/IOASID 相关支撑、Linux DSWQ 基础设施、测试基础设施,以及迁移/加速器实例 demo 等。

社区关键建议:PoC 需要明确写入提案,测试与发行版合作要可落地

会议讨论中,RISC-V International 的 Rafael Sene 与 Isaac Chute 提出了两点直接影响 TSC 评审质量的建议:

  • Rafael:提案中需要明确 PoC(Proof of Concept)路径
    Rafael 指出,TSC 在评审 TG Proposal 及后续 ratification 计划时,一定会追问“如何证明规范可行且可复现”。因此建议在文档中补充一句或一段,明确 PoC 作为软件生态的一部分:TG 将在需要时推动 PoC 落地,用以展示规范“能工作、可复制、可验证”。
  • Isaac:能否明确与主流发行版/生态伙伴的协作方式
    Isaac 关心当 PoC 与 Linux 相关工作推进时,是否需要考虑聚焦哪些发行版(如 Debian 等),以及如何 leverage RISC-V International 生态中“主流发行版成员”的资源参与验证与推广。

字节跳动崔运辉:DSWQ 相关软件开发进展与 Linux 内核侧具体需要做哪些工作?郭任回应:TG 的主目标是规范制定,但软件生态与 PoC/开源推进会作为重要配套来验证规范方向与可实现性,团队也在投入资源并计划逐步开源,与社区协作完善。

后续计划

  • 郭任将根据本次反馈继续完善 DSWQ TG Proposal:补充 PoC 描述、细化生态协作方式。
  • Data Center SIG 将继续在邮件列表跟进讨论,推动提案进入 TSC 评审流程。

会议在感谢各方参与后结束。此次讨论标志着 Data Center SIG 正在把“共享队列 + 虚拟化 + 热迁移”这一云关键路径能力,从点状提案推进到任务组化、规范化与可验证的工程路线图阶段。

—— 完 ——

相关文章
|
1月前
|
缓存 达摩院 数据库
RISC-V 基金会 Data Center SIG 第六次会议圆满结束,推动数据中心缺口改进及引入
重点围绕“在 RISC-V 架构中引入持久化内存(Persistent Memory,PMem)相关支持”等的方向展开讨论。
|
19天前
|
机器学习/深度学习 JSON 安全
基于品牌冒充的钓鱼攻击演化趋势与多维防御机制研究——以 Microsoft、Facebook、Roblox 为例
2025年Q4全球钓鱼攻击呈品牌集中化趋势:Microsoft首超Facebook成被冒充最多品牌,Roblox跻身第三。本文深度剖析三者技术实现、心理诱导机制与用户特征,复现钓鱼页面代码逻辑,并提出融合AI识别、FIDO2强认证与差异化安全培训的多维防御体系。(239字)
120 17
|
1月前
|
人工智能 弹性计算 运维
小白也能上手!阿里云推出 OpenClaw 极速简易部署方案
阿里云OpenClaw是开源本地优先AI智能体平台,支持邮件处理、周报生成、资料查询、代码编写等任务,数据全留本地,保障隐私。技术小白也能通过阿里云轻量服务器“一键部署”,几分钟即可拥有专属AI数字员工。
284 15
|
18天前
|
人工智能 算法 机器人
OpenClaw爆红抢谁饭碗?一句话执行任务重构App分发范式
OpenClaw 凭借“一句话执行任务”红遍硅谷。本文深度解析 AI 代理环境下 App 入口蒸发难题,探讨开发者如何利用 App智能传参安装 与 参数还原算法 实现 一键拉起 与 免填邀请码,在 AGI 时代重构 全渠道归因 体系。
|
10天前
|
人工智能 前端开发 Serverless
10 分钟部署 Qwen3!阿里云 FunctionAI 模板实测,成本低至 ¥0.5/小时
通义千问Qwen3正式开源8款混合推理模型,含2款MoE(如Qwen3-235B-A22B)和6款Dense模型(从0.6B到32B),支持119种语言、思考/非思考双模式,在代码、数学等基准测试中表现优异。依托阿里云函数计算FC与FunctionAI平台,提供vLLM/SGLang/Ollama等多种部署方式,开箱即用。
490 30
|
7天前
|
存储 安全 C语言
C语言深度解析:函数指针的底层本质与避坑指南
本文深入剖析C语言函数指针的本质——函数名即代码段入口地址,厘清其与数据指针的根本差异;系统梳理回调、跳转表、中断向量、动态库等核心应用场景;重点警示签名不匹配、`void*`强转、野指针调用三大致命陷阱,并给出`typedef`封装、空值校验、边界防护等最佳实践。(239字)
322 134
|
18天前
|
人工智能 监控 网络安全
2026年开工不想工作?3分钟部署OpenClaw(原Clawdbot)AI助手 24小时为我工作
春节假期结束,不少人刚回到工位就陷入“开工倦怠”:不想回邮件、不想整理报表、不想写代码、不想处理重复琐碎的事务,只想发呆摸鱼,但工作任务堆成山, deadlines 步步紧逼。有没有一种方式,能让AI替我们完成大部分机械性、重复性工作,实现“人在摸鱼,工作已完成”的理想状态?答案就是**阿里云OpenClaw(原Clawdbot)**——一款能7×24小时不间断工作的开源AI自动化助手,无需人工盯守,一句话下达指令,就能自动执行办公、开发、搜索、整理、定时任务等全场景操作。
289 9
|
12天前
|
存储 自然语言处理 数据可视化
大模型应用:语料库治理实战:基于 text2vec+BERT 的由浅入深解析.41
本文介绍中小企业及个人开发者如何高效治理小语料库,提出“以质取胜”理念。基于本地部署的text2vec-base-chinese(语义去重)与bert-base-chinese(质量评分)双模型协同方案,覆盖清洗、去重、质检、细筛等六步流程,显著提升模型效果,兼顾安全性与低成本。(239字)
159 15
|
18天前
|
人工智能 自然语言处理 监控
大型企业怎么做数据治理?(2026年2月最新)
2026年,数据治理成企业核心竞争力关键。本文系统解析数据孤岛、标准缺失等五大挑战,梳理DAMA、DCMM、OneData等主流方法论,并详解资产化管理、智能质控等核心能力。重点介绍瓴羊Dataphin——依托OneData与Data Agent智能体,实现自然语言建模、AI血缘分析等,助力企业将数据治理从“成本中心”升级为“价值引擎”。(239字)

热门文章

最新文章