如何利用 AI Agent 实现热补丁的自动化生成

简介: AI 不仅重塑了漏洞发现的效率,更应成为加速漏洞修复的核心驱动力。

编者按在 AI 技术的推波助澜下,高危内核 CVE 以周级频率爆发,系统修复面临前所未有的压力。尽管内核热补丁技术克服了传统修复需重启服务器的弊端,实现了业务零中断,但从上游原始 Patch 到可加载热补丁的转化过程,仍依赖大量繁琐的人工改写。


针对这一痛点,龙蜥社区系统运维 SIG 成员高向阳在 2026 全国大学生计算机系统能力大赛技术培训会上,详细剖析了如何利用 AI Agent 实现热补丁的自动化生成,成功将补丁制作周期从“天级别”压缩至“分钟级别”,有力证明了 AI Agent 已成为驱动内核安全修复效率变革的新引擎。以下为本次分享内容:

背景:AI辅助下的内核CVE周级涌现

如果你最近关注 Linux 内核安全动态,一定已经注意到一个令人警惕的趋势——在 AI 的辅助下,高危内核 CVE 正以周级的速度密集涌现。

以近期引发广泛关注的几个漏洞为例:安全研究员首先提出攻击假设,再由 AI 枚举出完整的攻击路径。其中某个漏洞在公开后一小时内就被 AI 发现,影响范围覆盖从 Linux 4.14 到 6.19、长达七年的所有内核版本。攻击方式也极为简单粗暴——仅需一个七百多字节的 Python 程序,即可通过攻击 Page Cache 实现一键本地提权至 root。

更令人担忧的是,这些漏洞的发现和公开速度越来越快。从某个漏洞公开到下一个漏洞被发现,间隔甚至不到一周。很多企业在第一个漏洞尚未修复完成时,第二个、第三个漏洞已经接踵而至,修复压力巨大。

而在多租户云环境中,这些可被用于本地提权的漏洞一旦利用成功,主机逃逸将变得易如反掌,线上大量的 Linux 服务器都需要尽快修复。

传统修复 vs 内核热补丁

传统方式:升级内核,必须重启

传统的内核修复流程通常是:获取最新的修复补丁 → 重新构建内核镜像 → 重新部署替换 → 重启服务器生效

整个流程对业务最大的影响就是必须重启服务器,这意味着业务中断。

内核热补丁:飞行中更换引擎

相比之下,内核热补丁(Live Patching)最大的优势就是无需重启,就像在一架飞行中的飞机上更换引擎零件,业务无感知地完成修复。具体而言,内核热补丁在 CVE 修复场景中有两大核心优势:

  • 构建、测试和部署流程更快
  • 无需重启,业务影响极小

技术框架:内核热补丁是如何工作的?

 


内核热补丁整体技术框架可分为三层,第一层为 kpatch工具链。kpatch 是一套用于构建和管理内核热补丁的工具。其中 Kpatch-build 是核心组件,其流程是:

  • 对原始内核源码进行一次全量构建
  • 打上 Patch 文件,再进行一次增量构建
  • 对比二进制层面 .o 文件的差异,确定哪些函数被修改
  • 将修改后的函数链接到一起,生成最终的 .ko 内核模块
  • 加载这个 .ko 模块后,完成对特定函数链路的修复

第二层是 Livepatch 子系统。Kpatch 在内核中由 Livepatch 子系统支撑。该子系统在内核 4.0 及以上版本中已原生支持,其本质是通过 Ftrace 实现函数的动态重定向。第三层为 Ftrace 插桩机制。Ftrace 在编译时为每个函数的入口预留了一条空指令。在运行过程中,可以将这条空指令动态替换为跳转指令,跳转到新的函数入口,从而实现函数重定向。总体逻辑就是在内核运行过程中,替换特定函数的入口地址,使其跳转到新的函数实现。

从上游 Patch 到可加载热补丁存在一道鸿沟

上游的修复 Patch 并不能直接转化为可加载的热补丁,Kpatch 工具链对补丁有很多约束和限制:

约束项 说明
不能修改 init 函数 这些函数在引导阶段执行完毕后,对应内存段已被释放,无法再替换
不能修改静态分配的数据 例如向全局数组新增元素或变量
不能修改缺少 fentry 的函数 例如 lib 下的很多库函数采用静态链接,编译时未预留 fentry 入口
不能改变导出符号的签名 这会破坏内核 ABI,影响其他模块的调用
不能更改现有数据结构 例如向结构体中增加字段,运行中无法替换所有实例且风险极大
不能删除对静态局部变量的引用 /

由于这些约束的存在,上游修复 Patch 不能直接使用,必须经过人工改写和适配。目前这一过程完全依赖人工完成,一个 CVE 修复 Patch 可能需要数小时甚至数天才能完成改写。再加上线上存在大量不同版本的内核,每个版本迁移时还要根据基线差异进行额外调整。

当 CVE 密集涌现时,人工改写将成为瓶颈。

实战案例:copy_file 漏洞的热补丁改写

以近日公开的 copy_file 漏洞为例,我们来看看上游修复 Patch 到热补丁的实际改写过程。该漏洞源于加密模块中的一个零拷贝优化,导致越权篡改了只读的 Page Cache。攻击者可通过篡改 password 或 setuid 等文件,运行一段简单的 POC 程序即可从任意用户直接提权至 root,且影响范围时间跨度较长。

上游的修复方案是:回退 2017 年引入的零拷贝优化,改为拷贝后再写入。

上游修复的复杂度

以某个主流发行版的 5.10 内核开发分支为例,修复该 CVE 需要回合多个前置依赖 commit,最终提交包含十个 commit、十一个文件的修改,插入和删除的行数非常多。

直接构建热补丁会遇到的问题

如果直接用上游修复提交来构建热补丁,会遇到以下几类问题:

  • 问题一:修改了 Kernel Config

Patch 中包含了内核配置文件的修改。Config 用于控制编译过程,这种修改不仅无意义,还会导致大量代码条件编译发生变化,产生大量不被允许的修改。而修复该漏洞实际上并不需要修改内核配置。

  • 问题二:导出函数删除了参数

有两个函数删除了末尾的参数。一般情况下这种修改没有问题,但由于这两个函数是导出函数,直接删除参数相当于修改了函数签名,破坏了 ABI,这是不被允许的。

  • 问题三:删除了结构体成员

有两个结构体删除了部分成员。由于属于静态数据结构,这种修改不支持——无法在加载过程中替换所有数据结构实例,也无法更改内存布局。

  • 问题四:新增函数声明了导出符号

新增函数本身没有问题,但上游 Patch 中增加了导出符号的声明。内核运行时的符号表已固定,无法扩容或注册新符号,这也是不允许的。

改写策略

针对以上四类问题,我们分别采取以下改写策略:

  • Config 修改 → 直接去掉,不需要改内核配置
  • 删除参数 → 保留参数,仅在内部逻辑中不再使用该参数即可
  • 删除结构体成员 → 保留成员不删除,不再使用即可
  • 新增函数导出 → 去掉导出符号声明,函数仅在模块内部使用,不影响修复目的

改写完成后,文件变化从十一个缩减至七个,构建成功,加载后也能正常达成 CVE 修复的目的。

2026 大学生 OS 赛题要求及标准

2026 全国大学生计算机系统能力大赛中,龙蜥“内核 CVE 热补丁自动生成智能体”赛题,要求智能体能够在不改变原修复语义的基础上,自动完成补丁的改写和构建,达到高效、安全修复内核漏洞的目的。同时,高向阳也对参赛队伍提出了具体的评估标准和要求。


更多赛题详情点击右侧链接查看:龙蜥邀您参加 2026 全国大学生计算机系统能力大赛

结语

AI 不仅重塑了漏洞发现的效率,更应成为加速漏洞修复的核心驱动力。在 2026 全国大学生计算机系统能力大赛中,我们致力于推动内核热补丁技术从“人工驱动”向“智能体(Agent)驱动”的范式跃迁,通过引入 AI 智能体,旨在将热补丁的生成周期从传统的“天级”大幅压缩至“分钟级”。我们也期待各参赛队伍深耕系统底层,提出具有前瞻性与落地价值的创新解决方案。

视频回放链接:https://openanolis.cn/video/1633914108607529089


加入交流群

若你对智能运维(AIOps)、可观测性等感兴趣,欢迎搜索群号:94405014449 加入【操作系统控制台钉钉交流群】。在这里,你可以直接体验控制台最新功能,与社区大佬面对面交流最佳实践,获取第一手的技术答疑。


相关阅读文章:

从“救火”到“预见”:汽车行业操作系统智能运维解决方案

开源!智能运维助手上线,SysOM MCP 为 AI Agent 打开系统诊断之门

Anolis OS 深度集成运维利器,阿里云操作系统控制台上线

—— 完 ——

相关文章
|
1月前
|
缓存 安全 小程序
Lua-LSM 系列二:从 CopyFail 到 Dirty Frag,看 732 字节的漏洞,用 79 字节关上
最近发生的真实安全漏洞场景,展示 Lua-LSM 如何在 79 字节内完成对内核提权漏洞的热缓解。
|
4天前
|
缓存 测试技术 API
Qwen 3.7 Plus 与 Max 实测:性价比与多模态能力差异解析(2026)
2026 年 6 月 1 日,阿里悄无声息地发布了 Qwen 3.7 Plus,距 Qwen 3.7 Max 上线刚好 11 天。同样的 1M 上下文,同样的 35 小时自治上限。但价格才是头条:Plus 是 0.40/M输入,Max是 2.50/M——便宜约 6 倍——并且还能看图、看视频。Vision Arena 上 Plus 已经排到 #16。所以这周真正值得讨论的问题不是”要不要为视觉能力买单”,而是”Max 凭什么用 6 倍价格换来 2 个百分点的 benchmark 领先”。
|
4天前
|
人工智能 前端开发 数据挖掘
全链路实战:依托Codex完成PPT、数据分析、网页与APP一站式AI开发教程
在AI技术飞速迭代的当下,代码生成早已不是AI工具的单一能力边界。OpenAI旗下的Codex经过持续升级,如今已经成长为一款综合性智能生产力平台,除了经典的代码编写能力外,还支持插件调用、电脑远程操控、数据分析、多媒体制作、全品类应用开发等多元功能。本文将结合完整实操流程,一步步演示如何使用Codex完成PPT制作、体育赛事数据分析预测、网页开发以及移动端APP开发四大核心场景,全程记录操作指令、执行过程、代码实现以及问题优化方案,直观展现AI如何重塑传统工作与开发流程,同时剖析这套全链路AI工作模式的优势与现存局限。整套流程无需深厚的专业功底,普通办公人员、初级开发者都可以参考落地。
164 1
|
5天前
|
人工智能 缓存 弹性计算
阿里云服务器2核4G5M199元解析:独享型u1实例,性能、适用场景、购买和续费规则介绍
阿里云通用算力型u1实例(ecs.u1-c1m2.large)2核4G、5M带宽、80G ESSD Entry云盘,活动特惠价仅199元/年(官网价3498.36元),企业新老用户同享,续费同价至2027年3月31日,每人限购1台。该实例采用独享型架构,搭载Intel至强可扩展处理器,内网带宽1Gbit/s、收发包30万PPS、云盘IOPS 1万,性能稳定,适合企业官网、中小Web应用、轻量数据库及开发测试等场景。
|
1月前
|
安全 Linux 数据库
Omnissa Horizon 8 2603 发布 - 虚拟桌面基础架构 (VDI) 和应用软件
之前称为 VMware Horizon, 通过高效、安全的虚拟桌面交付增强您的工作空间
209 3
Omnissa Horizon 8 2603 发布 - 虚拟桌面基础架构 (VDI) 和应用软件
|
27天前
|
数据采集 JSON API
小红书笔记详情API实战总结(技术复盘)
本文为小红书笔记详情API实战复盘,涵盖OAuth2.0鉴权、代理与指纹配置避封、限流/风控应对等关键问题。详解note_id、access_token等核心参数及结构化返回字段(内容/媒体/互动/作者),助力竞品分析与内容监测。(239字)
|
2天前
|
弹性计算 负载均衡 安全
阿里云负载均衡(SLB)全链路对接与实战指南
本文系统讲解阿里云负载均衡(SLB)的完整对接流程,涵盖ALB、CLB、NLB三大产品选型、核心原理、实例创建、服务器组配置、监听设置、健康检查、会话保持、安全加固、性能优化及常见问题排查。从基础概念到高阶配置,结合实操步骤与代码示例,帮助用户快速掌握SLB对接ECS、IDC、函数计算等后端服务的方法,实现高可用、高性能的流量分发架构。
|
4天前
|
JSON 运维 监控
Skills 是什么?Claude 官方教你做一个好用的 Skill
Skills 可以理解成 Claude Code 给 Agent 准备的任务经验包。它把一类任务里反复出现的说明、脚本、模板、配置、坑点和历史记录放在一起,让 Claude 下次遇到类似任务时,可以直接复用已有经验。
Skills 是什么?Claude 官方教你做一个好用的 Skill
|
4天前
|
Web App开发 存储 人工智能
《本地大模型+Chrome插件:离线生产力指南》
本文聚焦Chrome新一代扩展标准下的插件无人值守化改造实践,剖析其打破人机交互割裂、实现信息获取到结果输出全链路自动化的核心价值。文章详细拆解了增量上下文注入、跨标签页语义关联、任务持久化断点续传等关键技术,介绍了学术文献整理等典型应用场景,同时探讨了性能优化、数据安全、本地大模型适配与离线执行等核心问题。
|
2月前
|
机器学习/深度学习 人工智能 数据可视化
Geo优化新范式:深度解析知识图谱构建工具与“双核四驱”实战策略
在生成式AI重塑信息分发的今天,SEO正升级为Geo(生成式引擎优化)。本文详解Geo底层逻辑:以知识图谱为枢纽,融合Protégé建模、Neo4j图谱、BERT抽取与JSON-LD标记,结合于磊首创“两大核心+四轮驱动”体系,助力企业提升AI引用率与数字可见度。
209 9

热门文章

最新文章