推理 → 行动 → 观察:用 LangChain + Python 实现一个智能体循环

简介: 智能体循环(Agentic Loop)突破单次问答局限,通过“推理→行动→观察”迭代闭环,让AI能自主分解任务、调用工具、持续优化直至目标完成,是构建真正自动化智能体的核心架构。

如果你用过 ChatGPT 或 Claude的话对标准聊天机器人的工作方式应该不陌生:提问然后得到一个回答。但如果交给它一个多步骤任务呢?比如:“帮我找到最便宜航班,查询我的常旅客积分,并预订最佳选项”。

这时标准聊天机器人就会卡住,因为它没有在单次响应之后继续推进的机制。

智能体循环架构(agentic loop architecture)就是为了解决这一局限而出现的。下面这篇介绍会说明它是什么、如何工作,以及如何把它实现出来。

简单聊天机器人与 AI 智能体的区别

聊天机器人以单次通过(single pass)的方式运行他的交互流程是:用户发送消息,LLM 生成响应,流程结束。一次输入对应一次输出,没有任何记忆或状态被带入下一步。

智能体则是被设计用来行动(act),而不只是响应。两者之间的差异,可以归结为一个非常基础的编程概念

while

循环。

智能体循环是一种迭代循环:LLM 在其中使用工具、根据反馈做出调整,并反复执行这一过程,直到任务彻底完成。

智能体循环的 5 个阶段

智能体循环一般跨越五个阶段。

  1. 感知(Perceive):智能体接收输入,可能是用户的 Prompt、某个 API 的响应,或是一条错误消息。
  2. 推理(Reason):LLM 处理这段上下文,决定下一步该做什么。
  3. 规划(Plan):面对复杂目标时,智能体会把目标拆解为更小的子任务。
  4. 行动(Act):智能体执行具体动作——运行代码、查询数据库或调用 API。
  5. 观察(Observe):智能体查看动作的结果,判断它是否生效,或者计划是否需要调整。

在多数任务中,核心执行循环可以进一步简化为持续迭代的三步:推理 → 行动 → 观察。

智能体循环的核心迭代

架构 / 流程图

下面是这一架构的简单可视化示意:

详细的智能体循环架构

循环实际是怎么跑起来的:一个简单示例

设想给一个智能体下达这样的指令:“找出 2026 年发表的、关于智能体记忆的被引用次数最多的论文,并对其进行总结。”

循环的执行过程大致如下:

  • 第 1 次迭代(推理 → 行动 → 观察):智能体推理出需要搜索 2026 年的论文;通过调用搜索 API 进行行动;观察到一份包含 15 篇论文的列表。
  • 第 2 次迭代:智能体推理出需要拿到被引用次数最多那篇结果的正文;通过文档检索工具进行行动;观察到完整的摘要。
  • 第 3 次迭代:智能体推理出信息已经足够;生成总结,结束循环。

在底层,整个架构归结为几行逻辑的Python 伪代码:

 while not done:  
    response = call_llm(messages)  

    if response has tool_calls:  
        results = execute_tools(response.tool_calls)  
        messages.append(results)  
    else:  
        done = True  
         return response

用 Python 实现一个基础版本(LangChain)

下面是用 Python、LangChain 和一个 Oracle 数据库连接来实现智能体循环的基础示例,其中 Oracle 数据库连接被用于工具执行。

 from langchain.agents import create_agent  
from langchain_core.tools import tool  
from langchain_core.messages import AIMessage, ToolMessage  

# 1. 定义智能体可以执行(ACT)的工具  
@tool  
def calculate(expression: str) -> str:  
    """对一个数学表达式求值。"""  
    pass # 此处实现  

@tool  
def timezone_convert(time_str: str, from_city: str, to_city: str) -> str:  
    """在城市之间转换本地时间。"""  
    pass # 此处实现  

# 2. 创建带工具的智能体(这会编译出 StateGraph 循环)  
agent = create_agent(  
    model=llm,  
    tools=[calculate, timezone_convert],  
    system_prompt="You are a precise assistant. Use tools to find answers."  
)  

# 3. 运行迭代循环  
QUESTION = "If I fly from London at 14:00 for 6 hours, what time do I land in New York?"  

for chunk in agent.stream({"messages": [("human", QUESTION)]}, stream_mode="values"):  
    last_msg = chunk["messages"][-1]  

    if isinstance(last_msg, AIMessage) and last_msg.tool_calls:  
        for call in last_msg.tool_calls:  
            print(f"[ACT] → Executing {call['name']}")  
    elif isinstance(last_msg, ToolMessage):  
        print(f"[OBSERVE] ← Result received")  
    elif isinstance(last_msg, AIMessage) and last_msg.content:  
         print(f"\\nFinal Answer: {last_msg.content}")

什么时候该用智能体循环,什么时候不该用

适合使用的场景:

  • 完成一个任务所需的步骤数无法事先确定。
  • 系统需要根据中间步骤的结果调整自身策略——例如某次搜索失败时,要换不同的关键词再试。
  • 任务完成度比原始速度更重要。

不适合使用的场景:

  • 固定序列的工作流:如果整个流程都是高度可预测、步骤固定的,更合适的做法是写一个确定性的代码 Pipeline。
  • 简单任务:只需要一次 LLM 调用加一次工具调用就能解决的事情,没必要套上迭代循环的开销。
  • 严格的延迟约束:循环的每一次迭代都要做一次 LLM 调用,处理时间和 Token 成本都会累加。如果速度是首要优先级,智能体循环可能会偏慢。

https://avoid.overfit.cn/post/ecdc7d58222c4632830c8ee9352c8f88

作者:Pranav Bagal

目录
相关文章
|
9天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
3136 8
|
12天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
3198 20
|
5天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
2130 3
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
|
24天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23591 15
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
1天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队版、Coding Plan或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
|
11天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2645 3
|
3天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全+三种模式+记忆体系+实战工作流完整手册
Claude Code 是当前最流行的终端级 AI 编程助手,能够直接在命令行中完成代码生成、项目理解、文件修改、命令执行、错误修复等全流程开发工作。它不依赖图形界面、不占用额外资源,却能深度理解项目结构,自动生成规范代码,大幅提升研发效率。
772 2
|
10天前
|
人工智能 安全 开发工具
Claude Code 官方工作原理与使用指南
Claude Code 不是传统代码补全工具,而是 Anthropic 推出的终端 AI 代理,具备代理循环、双驱动架构(模型+工具)、全局项目感知、6 种权限模式等核心能力,本文基于官方文档系统解析其工作原理与高效使用技巧。
1443 0

热门文章

最新文章