文章总结: 该文档对比分析AIAgent的两种设计哲学:AI-Legion代表完全自治的员工模式,通过Think-Act-Observe循环实现目标驱动和自纠错;ClaudeCode则采用人机协作的副驾驶模式,强调工具驱动和用户确认机制。文章从自治模型、状态管理、纠错机制和工具生态四个维度详细对比差异,指出AI-Legion适合探索型任务(如信息搜集),ClaudeCode适合执行型任务(如编码调试),并建议生产环境选择LangGraph等更稳定方案。 综合评分: 85 文章分类: AI安全,解决方案,安全工具,技术标准,安全运营
Agent 应该像员工,还是像副驾驶?我对比了 AI-Legion 和 Claude Code
原创
Liam Liam
说说别的
2026年6月11日 16:28 新加坡
在小说阅读器读本章
去阅读
最近忙于网络安全和AI,对agent比较沉迷,分享一下对agent的小看法。
个人认为AI Agent 其实有两种完全不同的想象。
一种是:你给它一个目标,它像员工一样自己搜索、判断、重试、写报告。另一种是:它坐在你旁边,像副驾驶一样帮你读代码、改文件、跑命令,但关键步骤仍然让你确认。前者接近 AI-Legion,后者接近 Claude Code。
所以我在这里不讨论“哪个更强”,而是讨论一个更本质的问题:Agent 到底应该像员工,还是像副驾驶?
一、两个 Agent,两种哲学
AI Agent 火了两年,市面上的框架已经多到数不过来。但真正能代表两种设计哲学的,我挑了两个:
| 核心理念 | 完全自治,人类只给目标 | 人机协作,人在循环中 | | — | — | — | | 循环模型 | Think → Act → Observe | 用户指令 → 工具调用 → 结果返回 | | 启动方式 | 给一个目标,Agent 自己拆解 | 每次对话开始,用户驱动 | | 结束条件 | Agent 自己判断任务完成 | 用户确认或新指令 | | 开源 | ✅ | ❌(闭源产品) |
这不是”谁更好”的问题。这是两种对 AI Agent 完全不同的想象。
二、AI-Legion:把 Agent 当成独立员工
开源地址:https://github.com/eumemic/ai-legion
AI-Legion 的核心是一个 Think-Act-Observe 循环:
- Think(思考)→ 规划下一步该做什么
- Act(行动)→ 调用工具执行操作(搜索、读链接、写文件)
- Observe(观察)→ 分析执行结果,决定下一步
- 回到 Think,重复循环
关键设计:Agent 自己决定什么时候停。
举个例子。给它一个任务:”整理某个漏洞库的最新动态”:
- Think:需要搜索 → Act:发起 Google Search → Observe:搜到一堆链接
- Think:需要看细节 → Act:点进链接 → Observe:链接失效了
- Think:换个关键词重试 → Act:新搜索 → Observe:拿到有效数据
- Think:任务完成 → 整理输出
整个过程零人工介入。Agent 遇到死链接不会报错退出,而是自己调整策略。这就是 AI-Legion 最核心的设计理念:自治 = 目标驱动的循环 + 自纠错能力。
三、Claude Code:把 Agent 当成协作伙伴
Claude Code 的 Agent 模式走的完全是另一条路。
Claude Code 不是以无人值守自治为默认产品形态,而是把自治能力包在权限、上下文和用户协作机制里,或者说是一套工具驱动的协作模型:
-
Bash Tool:执行 shell 命令,输出返回给 Claude 分析
-
Edit Tool:精确修改文件,不像传统 Agent 那样重写整个文件
-
Task Tool:启动子 Agent 处理独立子任务(最接近多 Agent 的概念)
-
MCP Tools:通过标准化协议接入外部服务(数据库、API、文件系统)
关键差异:每一步的结果都返回给用户可见。用户随时可以打断、纠正、换方向。
Claude Code 的哲学是:AI 是增强器,不是替代品。它是坐在你旁边的副驾驶,而不是你派出去独立执行任务的员工。
四、四个维度的差异对比
4.1 自治模型
| 决策权 | Agent 独占 | 用户 + Claude 共享 | | — | — | — | | 中断机制 | 无(除非手动 kill) | 每个工具调用后可打断 | | 多步规划 | Agent 自主分解目标 | 用户提供方向,Claude 逐 step 执行 | | 适用场景 | 信息搜集、Research | 编码、调试、重构 |
本质差异:AI-Legion 追求”少问多做”,Claude Code 追求”多确认少犯错”。
4.2 状态管理
AI-Legion 把状态直接写在文件系统里:
.store/
├── agent-1/
│ ├── memory # Agent 记忆
│ ├── goals # 目标状态
│ └── notes # 执行笔记
├── agent-2/
│ └── …
这是一个非常务实的选型。好处:
-
断点续跑:进程崩了,重启后从
.store/恢复状态 -
细粒度重置:出错了删特定目录,不用清空整个环境
-
可调试:删掉出错点之后的 memory 事件,相当于”时光倒流”
Claude Code 的状态管理是隐式的——对话历史就是状态。/compact 命令可以压缩上下文,但本质上是对话驱动而非文件系统驱动。
差异根源:AI-Legion 是为长时间无人值守设计的,必须持久化。Claude Code 假设用户一直在屏幕前,对话历史就够了。
4.3 自纠错机制
这是 AI-Legion 亮眼也危险的设计:
-
遇到错误自动换策略重试
-
链接失效自动换关键词搜索
-
工具调用失败自动降级
但代价是:
⚠️ 代理可能在错误的循环里烧掉大量 Token,尤其是最近刚释放出来的Mythos模型。
Claude Code 的处理方式简单粗暴:出错就停,让用户决定下一步。
4.4 工具生态
| 维度 | AI-Legion | Claude Code | | — | — | — | | 内置工具 | Google Search, Hacker News | Bash, Edit, Read, Write, WebSearch, WebFetch | | 扩展方式 | Custom Tool Interface | MCP 协议(标准化) | | 工具发现 | Event Dictionary(内部通信) | MCP Server 注册 | | 工具并行 | ✅ 支持 | ✅ 支持 | | 社区工具量 | 生态明显少于MCP | 数百个 MCP Server |
工具的”质”不在数量。 AI-Legion 的 Event Dictionary 让工具间能互相通信(搜索工具的结果自动喂给分析工具),但接入新工具门槛高。Claude Code 的 MCP 是标准化协议,虽然工具间没有原生的”对话”机制,但接入成本几乎为零。
五、为什么 AI-Legion 只有 1.4K Stars(截止2026-06-11)
这个数字很诚实。不是因为技术不好,而是因为:
- Token 消耗不可控:自主循环意味着 API 调用次数不可预测。社区有人反馈”一天烧掉一个月配额”。
- 生产环境不可用:没有 SLO 概念,不保证成功率,不适合需要可靠性的场景。
- 社区成熟度低:踩坑了大概率得自己看源码。对中文场景无优化。
- 没有商业模式:纯开源项目,缺乏持续的文档和最佳实践投入。
- 相比之下,Claude Code 背靠 Anthropic,有专业团队维护。
但这不代表 AI-Legion 没有价值。它的设计思路——Think-Act-Observe 循环 + 文件系统状态 + 细粒度调试——是任何自治 Agent 框架都绕不开的核心问题。
六、什么时候用哪个
| 场景 | 推荐 | | — | — | | 日常编码、调试、重构 | Claude Code | | 需要人工判断的复杂决策 | Claude Code | | 信息搜集与聚合(Research) | AI-Legion(试验) | | 需要验证多 Agent 协作可行性 | AI-Legion(学习价值高) | | 生产环境 / 有 SLO 要求 | 都不推荐 (LangGraph 更合适) | | 安全敏感操作 | Claude Code(人在循环中) |
七、本质分歧:Agent 要不要”长脑子”
两种架构的背后,是对 AI Agent 未来的根本分歧:
-
AI-Legion 派:Agent 应该有”内循环”,自己做决策、纠错、完成目标。人类设定终点,不干预过程。
-
Claude Code 派:Agent 是工具增强,不是独立员工。最高效的模式是”人类判断力 + AI 执行力”。
个人判断:两种模式会并存,但适用场景完全不同。
AI-Legion 适合探索型任务——信息搜集、竞品分析、Research。这类任务的目标明确但路径不确定,需要 Agent 自己探索。
Claude Code 适合执行型任务——编码、调试、部署。这类任务路径相对确定,但每一步的质量要求高,人类判断不可或缺。
把 AI-Legion 拿来写代码,你会被气死(改错了不会问你就自己覆盖)。用 Claude Code 做纯 Research,你会嫌它烦(每步都要确认)。
工具没有绝对的好坏,只有匹配不匹配。
一个值得关注的趋势:Claude Code 的 Task Tool 已经在往”自治子 Agent”方向试探——它允许你启动独立的子 Agent 处理子任务。如果未来 Anthropic 给 Task Tool 加上”循环 + 自纠错”能力,那就会是两种哲学的交汇点。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:说说别的 Liam Liam《Agent 应该像员工,还是像副驾驶?我对比了 AI-Legion 和 Claude Code》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论