07|Agent 记忆系统:短期上下文、长期规则和项目知识

简介: 编程Agent的记忆并非“永久记住所有内容”,而是科学的上下文工程。本文厘清三类记忆:短期上下文(任务现场)、长期规则(团队约定)和项目知识(按需检索),强调分类管理、避免污染,并给出落地实践与判断标准,助你构建清晰、可维护的Agent记忆体系。(239字)

ScreenShot_2026-06-02_212013_590.png

编程 Agent 的记忆问题,很容易被误解。

很多人以为“记忆”就是让模型永远记住所有对话。真实情况不是这样。模型本身不会自动带着你上周的项目细节进入今天的任务。Harness 必须把需要保留的信息,以某种形式重新加载进上下文。

所以,Agent 记忆不是玄学,而是上下文工程。

三类记忆

在工程实践里,可以把 Agent 记忆分成三类。

第一类是短期上下文。它存在于当前会话里,包括用户任务、对话历史、文件内容、工具输出、测试结果。会话结束后,它通常不会自动进入下一次任务。

第二类是长期规则。比如 CLAUDE.md、AGENTS.md、Cursor Rules。这些文件记录项目约定、构建命令、代码风格、架构边界,每次会话开始时加载。

第三类是项目知识。比如代码图谱、文档索引、历史故障记录、接口说明、设计决策。这类知识通常不应该全部塞进上下文,而应该按需检索。

image.png

这三类记忆不能混用。把所有项目知识都塞进长期规则,会让上下文变脏;把关键团队规范只放在对话里,下次就会丢。

短期上下文:任务现场

短期上下文是 Agent 当前正在处理的现场。

比如你让它修一个 bug,它会逐步收集:

  • 报错信息;
  • 相关文件;
  • 测试输出;
  • Git diff;
  • 用户补充说明;
  • 中间计划。

短期上下文适合放当前任务相关的信息,不适合承载长期规范。

一个常见问题是长任务做着做着上下文满了。Harness 会压缩或摘要旧内容,但摘要一定会丢细节。重要规则如果只在对话开头说过,后面可能不再可靠。

解决方法是:长期规则写进规则文件,任务关键点阶段性复述,复杂任务拆小。

长期规则:团队约定

长期规则的价值,是减少重复解释。

比如:

本项目后端使用 Java 21 和 Spring Boot。
数据库迁移脚本放在 sql/migration。
所有接口错误返回 ApiError。
提交前必须运行 mvn test。
不要修改 generated 目录。

这些信息每次任务都可能有用,适合写进 CLAUDE.md、AGENTS.md 或 .cursor/rules

但长期规则要克制。Claude Code 官方文档也提醒,CLAUDE.md 内容越具体、越简洁,越容易被遵守;太大、冲突或模糊都会降低效果。

一个经验是:项目级规则控制在 100-200 行以内。超过这个长度,就应该拆成路径规则或 Skills。

项目知识:按需召回

项目知识往往很大。

比如:

  • 全部 API 文档;
  • 历史 PR;
  • 事故复盘;
  • 代码调用图;
  • 数据库表结构;
  • 产品需求;
  • 设计稿说明。

这些信息不能每次都加载。正确方式是索引起来,任务需要时按需召回。

这就是 CodeGraph、Understand-Anything、RAG、MCP 文档服务的价值。它们不只是“存资料”,而是帮助 Agent 在合适时间找到相关知识。

记忆污染

记忆不是越多越好。

记忆污染常见于三种情况。

第一,旧规则没删。项目已经从 npm 切到 pnpm,但规则里还写 npm。

第二,个人偏好混进团队规则。某个开发者喜欢某种写法,不代表团队都应该遵守。

第三,临时结论变成长期事实。一次排障时的猜测被写进记忆,下次 Agent 当成真相。

所以记忆需要维护。规则文件要像代码一样 Review,过期内容要删,冲突规则要合并。

真实落地方式

一个团队可以这样组织记忆:

AGENTS.md
  通用 Agent 指令,供多种工具读取

CLAUDE.md
  Claude Code 专用补充

.cursor/rules/
  Cursor 路径级规则

docs/architecture.md
  架构说明,按需引用

.codegraph/
  代码索引,本地生成

规则里只写长期稳定的事。复杂流程放 Skills。大量知识放索引系统。临时任务信息留在会话里。

什么时候该写入记忆

可以用四个判断标准。

第一,Agent 第二次犯同样错误。

第二,Code Review 提醒了某个项目规则。

第三,新人也需要知道这条信息。

第四,这条信息未来多个任务都会用到。

如果只对当前任务有用,不要写进长期规则。

总结

Agent 记忆的核心不是“让模型什么都记住”,而是把信息放到正确位置。

当前任务信息:放短期上下文
团队稳定约定:放长期规则
大量项目资料:放知识索引
必须强制执行:放权限和 hooks

记忆系统做得好,Agent 会越来越懂项目;做得差,它只会越来越混乱。

目录
相关文章
|
6小时前
|
JavaScript 定位技术 API
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
CodeGraph 是一款爆火的本地代码智能工具,通过 tree-sitter 解析 AST 构建结构化知识图谱(存于 SQLite),为编程 Agent 提前生成“代码地图”。它显著降低 Agent 在中大型项目中的探索成本——实测工具调用减少71%、Token 降57%、速度提升46%,支持19+语言及主流框架路由识别,完全离线、无需 API Key。
288 1
CodeGraph 爆火:编程 Agent 需要的不是更多上下文,而是一张提前画好的代码地图
|
3月前
|
人工智能 Linux API
【最全】OpenClaw 阿里云/MacOS/Linux/Windows11本地部署流程+百炼API / SKill 接入及常见问题解答
OpenClaw(Clawdbot)作为开源的AI代理框架,凭借本地部署的隐私性、多端交互的灵活性以及可扩展的技能包体系,成为2026年AI工具生态中极具实用性的本地智能助手。与传统对话式AI不同,OpenClaw可通过技能包(Skills)实现浏览器操作、文件管理、办公自动化等实际工作流的落地,且能运行在MacOS、Linux、Windows11等主流系统,同时支持对接阿里云百炼等免费大模型资源,满足零基础用户的本地部署需求。本文将从多系统部署流程、阿里云百炼API配置、核心技能安装、常见问题解答四个维度,为新手提供完整的OpenClaw使用指南,全程无需专业代码基础,仅需跟随步骤执行命令即
842 3
|
6小时前
|
人工智能 JSON 自然语言处理
阿里云百炼产品月报【2026年5月】
本月阿里云百炼平台重磅升级:发布Qwen3.7系列大模型(Max版推理后付费5折)、Qwen3.5实时语音翻译模型及HappyHorse-1.0(8折体验);上线官方CLI工具,支持10+模态一键调用;Token Plan支持多座席共享与精细化管理;MCP广场新增航班、天气等专业服务;金融、法律垂直领域上新20+智能应用模板。
228 3
|
6小时前
|
自然语言处理 安全
06|Skills、Commands、Rules、Hooks 到底各管什么
本文厘清Agent Harness中Skills、Commands、Rules、Hooks四大核心概念的边界与协作:Rules规范长期习惯,Skills封装多步流程,Commands提供快捷入口,Hooks实现强制自动化。四者分层协同,助团队将经验沉淀为稳定、可演进的智能工作流。(239字)
36 1
|
6小时前
|
存储 安全 Java
AgentScope Java 2.0:打造分布式、企业级智能体底座
AgentScope 2.0 面向分布式部署、稳定运行、权限安全等企业级需求全面升级,打造支持多租户隔离与长期稳定运行的企业级智能体底座。
|
6小时前
|
人工智能 缓存 弹性计算
阿里云服务器2核4G5M199元解析:独享型u1实例,性能、适用场景、购买和续费规则介绍
阿里云通用算力型u1实例(ecs.u1-c1m2.large)2核4G、5M带宽、80G ESSD Entry云盘,活动特惠价仅199元/年(官网价3498.36元),企业新老用户同享,续费同价至2027年3月31日,每人限购1台。该实例采用独享型架构,搭载Intel至强可扩展处理器,内网带宽1Gbit/s、收发包30万PPS、云盘IOPS 1万,性能稳定,适合企业官网、中小Web应用、轻量数据库及开发测试等场景。
|
6小时前
|
人工智能 自然语言处理 IDE
Vibe Coding 实战:定义不是关键,可落地的工作流才是核心
vibe coding是“人类定义意图、AI实现细节”的新型编程范式,非简单让AI写代码。它强调工程规范先行、需求精准定义、任务结构化拆解与闭环迭代。经8个项目验证,开发效率提升300%+,成功率从30%升至90%。关键在规则,不在prompt。(239字)
229 1
|
6小时前
|
Java Windows
windows版jdk版本管理工具
JC-jEnv 是 Windows 下轻量级 Java 版本管理工具,支持本地 JDK 管理、远程一键安装(如 `jvms install 21.0.4`)、快速切换(`jvms switch`)及项目级版本隔离,操作简洁,无需手动配环境变量。
162 4
|
6小时前
|
安全 NoSQL Java
《ZAKU渗透论:卓伊凡的2026渗透工程》信息收集——黑客怎么找到你?
本章详解渗透测试中至关重要的信息收集环节:占全程50%以上工作量。涵盖被动(搜索引擎、GitHub、社交媒体、Whois、历史快照)与主动(DNS查询、子域名枚举、端口扫描、目录探测)两大策略,并聚焦2026年新趋势——供应链踩点。目标是绘制精准“攻击地图”,找到阻力最小的突破口。(239字)
184 2