2026-06-17 04:42:19 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 该文档对比分析AIAgent的两种设计哲学：AI-Legion代表完全自治的员工模式，通过Think-Act-Observe循环实现目标驱动和自纠错；ClaudeCode则采用人机协作的副驾驶模式，强调工具驱动和用户确认机制。文章从自治模型、状态管理、纠错机制和工具生态四个维度详细对比差异，指出AI-Legion适合探索型任务（如信息搜集），ClaudeCode适合执行型任务（如编码调试），并建议生产环境选择LangGraph等更稳定方案。 综合评分： 85 文章分类： AI安全,解决方案,安全工具,技术标准,安全运营

cover_image

Agent 应该像员工，还是像副驾驶？我对比了 AI-Legion 和 Claude Code

原创

Liam Liam

说说别的

2026年6月11日 16:28 新加坡

在小说阅读器读本章

去阅读

最近忙于网络安全和AI，对agent比较沉迷，分享一下对agent的小看法。

个人认为AI Agent 其实有两种完全不同的想象。

一种是：你给它一个目标，它像员工一样自己搜索、判断、重试、写报告。另一种是：它坐在你旁边，像副驾驶一样帮你读代码、改文件、跑命令，但关键步骤仍然让你确认。前者接近 AI-Legion，后者接近 Claude Code。

所以我在这里不讨论“哪个更强”，而是讨论一个更本质的问题：Agent 到底应该像员工，还是像副驾驶？

一、两个 Agent，两种哲学

AI Agent 火了两年，市面上的框架已经多到数不过来。但真正能代表两种设计哲学的，我挑了两个：

这不是”谁更好”的问题。这是两种对 AI Agent 完全不同的想象。

二、AI-Legion：把 Agent 当成独立员工

开源地址：https://github.com/eumemic/ai-legion

AI-Legion 的核心是一个 Think-Act-Observe 循环：

Think（思考）→ 规划下一步该做什么
Act（行动）→ 调用工具执行操作（搜索、读链接、写文件）
Observe（观察）→ 分析执行结果，决定下一步
回到 Think，重复循环

关键设计：Agent 自己决定什么时候停。

举个例子。给它一个任务：”整理某个漏洞库的最新动态”：

Think：需要搜索 → Act：发起 Google Search → Observe：搜到一堆链接
Think：需要看细节 → Act：点进链接 → Observe：链接失效了
Think：换个关键词重试 → Act：新搜索 → Observe：拿到有效数据
Think：任务完成 → 整理输出

整个过程零人工介入。Agent 遇到死链接不会报错退出，而是自己调整策略。这就是 AI-Legion 最核心的设计理念：自治 = 目标驱动的循环 + 自纠错能力。

三、Claude Code：把 Agent 当成协作伙伴

Claude Code 的 Agent 模式走的完全是另一条路。

Claude Code 不是以无人值守自治为默认产品形态，而是把自治能力包在权限、上下文和用户协作机制里，或者说是一套工具驱动的协作模型：

Bash Tool：执行 shell 命令，输出返回给 Claude 分析
Edit Tool：精确修改文件，不像传统 Agent 那样重写整个文件
Task Tool：启动子 Agent 处理独立子任务（最接近多 Agent 的概念）
MCP Tools：通过标准化协议接入外部服务（数据库、API、文件系统）

关键差异：每一步的结果都返回给用户可见。用户随时可以打断、纠正、换方向。

Claude Code 的哲学是：AI 是增强器，不是替代品。它是坐在你旁边的副驾驶，而不是你派出去独立执行任务的员工。

四、四个维度的差异对比

4.1 自治模型

本质差异：AI-Legion 追求”少问多做”，Claude Code 追求”多确认少犯错”。

4.2 状态管理

AI-Legion 把状态直接写在文件系统里：

.store/

├── agent-1/

│ ├── memory # Agent 记忆

│ ├── goals # 目标状态

│ └── notes # 执行笔记

├── agent-2/

│ └── …

这是一个非常务实的选型。好处：

断点续跑：进程崩了，重启后从 .store/ 恢复状态
细粒度重置：出错了删特定目录，不用清空整个环境
可调试：删掉出错点之后的 memory 事件，相当于”时光倒流”

Claude Code 的状态管理是隐式的——对话历史就是状态。/compact 命令可以压缩上下文，但本质上是对话驱动而非文件系统驱动。

差异根源：AI-Legion 是为长时间无人值守设计的，必须持久化。Claude Code 假设用户一直在屏幕前，对话历史就够了。

4.3 自纠错机制

这是 AI-Legion 亮眼也危险的设计：

遇到错误自动换策略重试
链接失效自动换关键词搜索
工具调用失败自动降级

但代价是：

⚠️ 代理可能在错误的循环里烧掉大量 Token，尤其是最近刚释放出来的Mythos模型。

Claude Code 的处理方式简单粗暴：出错就停，让用户决定下一步。

4.4 工具生态

工具的”质”不在数量。 AI-Legion 的 Event Dictionary 让工具间能互相通信（搜索工具的结果自动喂给分析工具），但接入新工具门槛高。Claude Code 的 MCP 是标准化协议，虽然工具间没有原生的”对话”机制，但接入成本几乎为零。

五、为什么 AI-Legion 只有 1.4K Stars（截止2026-06-11）

这个数字很诚实。不是因为技术不好，而是因为：

Token 消耗不可控：自主循环意味着 API 调用次数不可预测。社区有人反馈”一天烧掉一个月配额”。
生产环境不可用：没有 SLO 概念，不保证成功率，不适合需要可靠性的场景。
社区成熟度低：踩坑了大概率得自己看源码。对中文场景无优化。
没有商业模式：纯开源项目，缺乏持续的文档和最佳实践投入。
相比之下，Claude Code 背靠 Anthropic，有专业团队维护。

但这不代表 AI-Legion 没有价值。它的设计思路——Think-Act-Observe 循环 + 文件系统状态 + 细粒度调试——是任何自治 Agent 框架都绕不开的核心问题。

六、什么时候用哪个

七、本质分歧：Agent 要不要”长脑子”

两种架构的背后，是对 AI Agent 未来的根本分歧：

AI-Legion 派：Agent 应该有”内循环”，自己做决策、纠错、完成目标。人类设定终点，不干预过程。
Claude Code 派：Agent 是工具增强，不是独立员工。最高效的模式是”人类判断力 + AI 执行力”。

个人判断：两种模式会并存，但适用场景完全不同。

AI-Legion 适合探索型任务——信息搜集、竞品分析、Research。这类任务的目标明确但路径不确定，需要 Agent 自己探索。

Claude Code 适合执行型任务——编码、调试、部署。这类任务路径相对确定，但每一步的质量要求高，人类判断不可或缺。

把 AI-Legion 拿来写代码，你会被气死（改错了不会问你就自己覆盖）。用 Claude Code 做纯 Research，你会嫌它烦（每步都要确认）。

工具没有绝对的好坏，只有匹配不匹配。

一个值得关注的趋势：Claude Code 的 Task Tool 已经在往”自治子 Agent”方向试探——它允许你启动独立的子 Agent 处理子任务。如果未来 Anthropic 给 Task Tool 加上”循环 + 自纠错”能力，那就会是两种哲学的交汇点。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：说说别的 Liam Liam《Agent 应该像员工，还是像副驾驶？我对比了 AI-Legion 和 Claude Code》