AI 智能体(Agent)的技术栈已经从单纯的“调用 API”演变为一个包含感知、决策、记忆、执行四个核心维度的复杂系统。以下是目前国内主流且前沿的 AI 智能体开发技术栈全景图。
一、 模型层(大脑 - The Brain)
这是智能体最核心的推理引擎。
国产顶尖模型:DeepSeek-V3(目前国内性价比与推理能力平衡最好的模型)、通义千问 Qwen-2.5(开源生态极佳)、文心一言 4.0(合规性与企业级应用稳健)。
模型接入/中转:One-API 或 New-API(用于统一管理多个模型的 API 密钥、配额及负载均衡)。
推理加速:vLLM(高并发部署首选)或 Ollama(本地轻量化运行)。
二、 框架层(中枢神经 - Orchestration)
负责定义智能体的思考逻辑、工作流编排和多任务协作。
低代码/编排平台:
Dify:目前国内生产环境应用最广的框架,支持可视化工作流(Workflow)和 RAG 全流程管理。
Coze (扣子):字节跳动出品,插件生态极强,适合快速构建消费级应用。
编程级框架:
LangChain / LangGraph:适合需要精细控制状态机和循环逻辑的复杂 Agent。
MetaGPT:专注于多智能体(Multi-Agent)协作,模仿软件工程 SOP。
AutoGPT / BabyAGI:探索自主目标分解的实验性框架。
三、 知识与存储层(记忆 - Memory & RAG)
解决大模型“幻觉”和“长短期记忆”的关键。
向量数据库:Milvus(企业级大数据量)、Zilliz(云原生版)、Pinecone 或 Chroma(轻量化首选)。
检索增强(RAG)技术栈:
Embedding 模型:BGE (北京智源) 或 m3e 系列(中文理解力极强)。
重排序(Rerank):BGE-Reranker(大幅提升搜索结果与问题的匹配度)。
GraphRAG:利用知识图谱(如 NebulaGraph)处理复杂关系查询。
四、 工具层(手脚 - Tools & Skills)
让智能体能够操作物理世界或软件界面。
能力连接器:MCP (Model Context Protocol)。这是 2025 年最重要的协议,允许一次开发工具,在 Cursor、Claude、Dify 等多个平台通用。
API 聚合:聚合支付、企业微信/钉钉接口、联网搜索 (Serper/Google Search)。
执行环境:E2B 或 Piston(为 AI 提供安全的沙箱环境,用于运行 AI 生成的代码)。
五、 基础设施与工程化(底座 - Infrastructure)
部署环境:Docker(容器化标准)、Kubernetes(大规模调度)。
可观测性:LangSmith 或 Langfuse(用于追踪 AI 每一跳的思考过程、Token 消耗及性能监控)。
内容安全:接入百度、网易易盾等安全 API,确保输出符合国内监管合规要求。
开发方案建议:
1.快速原型(MVP)方案:
Coze + DeepSeek-V3 + 内置插件。
优势:零部署,数小时内即可上线。
2.企业级业务应用方案:
Dify + DeepSeek-V3/Qwen + Milvus + 私有化 API。
优势:数据可控,流程可视化,支持复杂的业务逻辑(如审批、查询数据库)。
3.极客/深度定制方案:
LangGraph + Python + MCP 插件 + 自建沙箱。
优势:可以实现真正的“自主 Agent”,能够自动写代码并执行,完成复杂闭环任务。