首页手记皇帝与军师：一张图看懂...

皇帝与军师：一张图看懂 OpenClaw、Agent、RAG、MCP 与 Skills 的江湖关系

标签：

深度学习人工智能自然语言处理

如果把大模型（LLM）比作一位足智多谋但被困在深宫中的“军师”，那么构建一个真正的 AI 智能体（Agent），就是一场为这位军师配备“手脚”、“记忆”和“兵书”的系统工程。

最近爆火的 OpenClaw（原名 Clawdbot），正是这套工程的集大成者。很多人被 Agent、RAG、MCP、Skills 这些术语绕晕了。今天，我们就用“古代朝廷”的比喻，彻底厘清它们之间的关系，并看看 OpenClaw 是如何将它们打包成一个能跑在你电脑上的“超级传令中枢”的。

一、核心比喻：从“光杆军师”到“全能宰相”

想象你是一个皇帝（用户），你的军师（AI 模型）虽然聪明绝顶，但他有几个致命弱点：

不知今夕何夕（知识截止）：
- 场景：你问边疆战况，军师摇头：“臣未出过宫门，不知外事。”
- 解法：RAG（检索增强生成）。你让人把最新的奏折、地图搬进军师府。军师先“查阅资料”，再结合自己的智慧回答你。这就是 RAG——给 AI 外挂一个实时知识库。
有嘴没手（行动缺失）：
- 场景：你说“让张三将军出兵”，军师说：“臣只动口，不动手，也不认识张三。”
- 解法：Function Calling（函数调用）。你规定一套圣旨格式（如 调兵：将军=张三），并安排一个传令官去执行。模型负责写圣旨，传令官负责跑腿。
各自为政（标准混乱）：
- 场景：你要调兵、调粮、修路，每个部门要的圣旨格式都不一样，军师累得够呛。
- 解法：MCP（模型上下文协议）。这是一套统一的“外交礼仪”。所有部门（工具）都按 MCP 标准对接，军师只需学会一种格式，就能指挥千军万马。
- 注：OpenClaw 为了极致的安全和灵活，选择不采用 MCP，而是自创了一套更轻量的机制（后文详述）。
不懂兵法（流程缺失）：
- 场景：军师知道怎么调兵、怎么调粮，但不知道“敌军攻城时，该先调兵还是先调粮”。
- 解法：Skills（技能）。你给军师一本《用兵手册》，上面写着：“遇敌攻城 -> 先调兵 -> 再调粮 -> 最后征民夫”。这就是 Skills——封装好的业务逻辑和工作流。
过目即忘（记忆缺失）：
- 场景：第二天你再问昨天的事，军师全忘了。
- 解法：Memory（记忆系统）。建立档案库，把重要的对话压缩存档。下次见面，军师能立刻想起：“陛下，您昨天说张将军勇猛，可重用。”

最终形态：
当这位军师拥有了大脑（模型）、记忆（Memory）、图书馆（RAG）、传令官（Function Call）和兵书（Skills），他就变成了一个能自主感知、决策、执行的Agent（智能体）。

而 OpenClaw，就是那个把这一切打包好、开源免费、能直接部署在你电脑或服务器上的“皇家传令中枢”。你只需在微信/飞书上发句话，它就能在后台调兵遣将、操作文件、浏览网页。

二、OpenClaw 架构拆解：五层神力

OpenClaw 之所以能在 GitHub 上狂揽 29 万星（截至 2026 年初），得益于其清晰且强大的分层架构。

1. 核心大脑：Agent（观察 - 计划 - 行动）

OpenClaw 的 Agent 遵循经典的 Observe-Plan-Act 循环：

观察：理解你的指令，读取当前状态。
计划：拆解任务，决定调用哪个 Skill。
行动：执行操作，获取结果。
循环：直到任务完成。

独特之处：它的配置完全文件化、可审计。每个 Agent 都有专属工作区，包含 AGENTS.md（职责）、SOUL.md（人设）、TOOLS.md（权限白名单）等。这让黑盒变成了透明的玻璃盒。

2. 记忆层：基于 SQLite 的混合检索

大模型本身是无状态的，OpenClaw 通过独特的 SQLite + 向量检索 方案解决记忆问题：

短期记忆：保留最近几轮对话原文。
长期记忆：后台自动调用小模型，将历史对话压缩成摘要，提取实体特征（如“用户偏好 Python”），存入数据库。
技术亮点：优先使用 sqlite-vec 原生扩展进行高速向量检索；若环境不支持，优雅降级为 JS 计算，确保功能永不掉线。

3. 知识层：RAG（检索增强生成）

为了解决模型知识“冻结”的问题，OpenClaw 内置了 RAG 引擎。

流程：用户提问 -> 本地检索 Markdown/文档库 -> 将相关片段注入 Prompt -> 模型生成答案。
优势：完全本地化，你的私有文档（如公司财报、个人笔记）无需上传云端，安全可控。

4. 工具层：为何放弃 MCP 而选择 Skills？

这是 OpenClaw 最具争议也最独特的设计。

MCP（模型上下文协议）：本是 Anthropic 推出的标准化工具协议，旨在统一接口。
OpenClaw 的选择：故意不支持 MCP。
- 原因：
  1. 安全：避免多模型协作带来的数据泄露风险。
  2. 灵活：不被固定协议束缚，迭代更快。
  3. 轻量：减少依赖，响应更迅速。
替代方案：直接用 Skills 机制，更简单粗暴高效。

5. 流程层：Skills（技能）——真正的杀手锏

如果说 Function Call 是“单个工具”，那 Skills 就是“封装好的完整战术”。

定义：解决了“何时用、按什么顺序用、如何组合”的问题。
生态：通过 clawhub 命令一键安装。官方注册中心已有超千款技能，涵盖：
- memory：持久化记忆
- web_search：联网搜索
- browser：浏览器自动化控制
- file：本地文件读写
体验：就像给军师配了一本本现成的《作战手册》，拿来即用。

三、实战对比：OpenClaw vs Dify

理解了上述概念，企业在选型时该如何决策？

维度	OpenClaw	Dify / Workflow
核心理念	Agent 派：相信 LLM 能自主规划	ChatBot 派：严格控制流程上下文
决策模式	动态决策，自主编排工具	静态编排，固定画布流程
适用场景	高自由度任务（运维、文件管理、复杂调研）	标准化任务（客服、审批、合规流程）
典型用户	极客、开发者、需要“自动驾驶”的场景	企业业务流程、需要严格审计的场景