2026-07-01 05:08:14 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 该文档系统分析了AIAgent从Harness到Loop的技术演进，指出2026年6月LoopEngineering成为核心趋势。文档通过BorisCherny等案例说明Loop模式如何实现自主运行，详细介绍了ETCLOVG七层架构和15种Loop模式（如VerifierLoop），并强调优化Harness可使性能提升10倍。文章最后建议开发者从安全可恢复的执行环境入手，逐步构建稳定的Loop系统。 综合评分： null 文章分类： AI安全,安全开发,安全工具,安全运营,技术标准,score:87

cover_image

从 Harness 到 Loop，Agent 战场已不在模型层

原创

阿珍阿珍

观雪安全

2026年6月29日 18:20 山东

在小说阅读器读本章

去阅读

事情是这样的。

2025 年 8 月，OpenAI 搞了一场很激进的实验。从一个完全空的 Git 仓库出发，让 Codex 自己写应用逻辑、测试、CI 配置、文档，整个过程没有一行代码是人写的。最终产出了超过 100 万行代码。

但更让我震惊的是另一个人。Claude Code 的负责人 Boris Cherny，一个月提交了 259 个 PR，497 次 commit，4 万行新增，3.8 万行删除。每一行都是 Claude Code 写的。他甚至把 IDE 卸载了，因为一个月没打开过。

他说了一句话，我当时看到就头皮发麻。「我已经不给 Claude 写提示词了。我有一堆循环在跑，是它们在给 Claude 下指令、决定下一步做什么。我的工作，就是写循环。」

不是哥们，你一个做 AI 工具的人，连提示词都不写了？？？

今天这篇文章，我就想聊聊这件事背后的完整逻辑。从 Harness 到 Loop，AI Agent 到底经历了什么。

◆先说 Harness

LangChain 给了一个特别干净的表达：Agent = Model + Harness。模型负责推理和生成，Harness 是模型之外的一切——系统提示词、工具调用接口、沙箱环境、编排逻辑、反馈循环、观测和评估体系。

你把 Agent 想象成一个人。模型是大脑，Harness 是身体和神经系统。Mitchell Hashimoto 说得更实操：每次 Agent 犯错，你就设计一个方案让它未来不再犯同样的错。Harness Engineering 说到底，就是踩坑之后修出来的护栏。

但 Harness 只是第一步。

◆Loop 的诞生

回到 Boris Cherny。他为什么不再写提示词了？因为如果每一轮都需要人去评估输出、告诉它下一步做什么，人才是真正的瓶颈。他需要的是一套让 Agent 自己转起来的系统。这就是 Loop。

Harness 决定了 Agent 在什么环境跑、有哪些工具、怎么管权限、怎么记状态。Loop 决定了反馈怎么进入下一步——做了一步，验证过了继续，没过就修了再来，撞上预算就停。人是规则的制定者，不再是每一步的推动者。

◆从 Prompt 到 Loop：四阶段演化

这套演化路线非常清晰。Google Cloud 的工程总监 Addy Osmani 把这事儿总结成了四个阶段。

2022 到 2024 年，Prompt Engineering。 核心问题就一个：怎么把指令表达清楚。

2025 年，重心变成了 Context Engineering。 你光给提示词不够，还得管模型能看见什么。

2026 年 3 月，Harness Engineering 被正式提出来。 CMU、耶鲁、亚马逊梳理了 170 多个开源项目，提出了 ETCLOVG 七层架构——执行环境、工具接口、上下文管理、生命周期编排、可观测性、验证、治理。缺一层都跑不稳。

然后到了 6 月，Loop Engineering 爆了。 开源项目 OpenClaw 的创建者 Peter Steinberger 发了条推文，大意是「你不该再写提示词了，你该设计循环去提示它们」。800 万浏览。紧接着 Boris Cherny 跟进，圈内也开始流传「Nobody writes prompts anymore」的说法。Osmani 写博客正式命了名。一夜之间，Loop 成了整个 AI 圈最火的话题。

四个阶段不是替代，是层层叠加：Prompt 告诉你问什么，Context 告诉你喂什么，Harness 告诉你搭什么环境，Loop 告诉你这个环境怎么自己转起来。

◆Harness 到底有多重要

先看几组数据：

同一款模型，只优化 Harness 层，不改模型权重，Terminal-Bench 2.0 准确率从 52.8% 干到 66.5%。只改工具格式和工具 Harness，不改模型，编码任务性能最高提升 10 倍。只改 Harness 设计，编码基准测试分数从 6.7% 飙到 68.3%。

说真的，我自己用不同 Agent 产品的时候感受非常直观。同一个 Claude 模型，放进 Cursor 和放进 Claude Code，表现就是不一样。不是模型变了，是外面那层壳变了。

◆ETCLOVG 七层架构

这个框架真正的价值，不是列了七个名字，而是把可观测性和治理作为独立的架构层看待。没有可观测性，故障无从排查。没有治理，再好的 Agent 也不敢放生产环境。

聊几个关键的层：

E 层——执行环境。 Agent 在 Docker 容器或隔离的 microVM 里跑，配了渐进式权限——高风险操作要先校验输入、再查权限、再走拦截、最后还要用户确认，任一步没过就短路返回。

C 层——上下文管理。 不是把所有信息塞进去，而是分层组织。项目规范放 AGENTS.md，角色定义放 SOUL.md，用户偏好放 USER.md，模型每轮只拿跟当前任务相关的信息。

L 层——生命周期编排。 是 ETCLOVG 里项目最多的一层，47 个。前沿设计引入了显式状态机来管理流程，每个状态之间有明确的转移条件和异常处理路径，不靠模型凭感觉决策。

V 层——验证。 是整个 Loop 体系的核心，下面讲 Verifier Loop 的时候会具体展开。

◆十五种 Loop 模式

很多人第一反应是：这不就是 Agent 本来就有的 ReAct 循环吗？思考、行动、观察、再思考，炒冷饭？

没错，Agent 从来不缺循环。ReAct 2022 年就提出来了。但 2026 年的 Loop Engineering 跟它的最大区别在于：任务变长了，而且变复杂了。过去一轮对话就能解决，现在任务变成几十分钟、几小时，甚至跨天运行。这时候模型自己说「我完成了」没有意义——你需要一套独立的验证体系、硬性停止条件、可持久化的状态、能在失败后恢复的协议。

社区在过去 30 天跑出了 15 种 Loop 模式，我挑三个最值得关注的。

Verifier Loop

Boris Cherny 的方法：Claude Code 跑主任务，再配一个更强的模型做 review，再加一个独立的 verifier。核心逻辑就一条：不要让干活的人自己给自己打分。没有 verifier 的 Loop，只是 Agent 自己说服自己「我做完了」。

Anti-Spin Loop

在 Loop 里显式加入反空转停止器：没有进展就停，重复尝试同一种失败方法就停，在两个错误方向之间来回 flip-flop 就停，超预算就停。真正的问题从来不是跑得不够多，而是跑得没意义。

Completion Contract

在执行之前先写出什么才算完成、每一条 requirement 对应什么证据。没有证据就不准声称完成。相当于在动手之前先签验收合同。

◆Loop 的真实成本

你可能觉得这些听起来很有道理，但我也想跟你分享代价。Loop 的真实成本是这波热潮里最被低估的话题。

一分钟间隔跑八个小时，480 次调用，Claude Sonnet 中等上下文一次大概 0.5 美元。一天 240 美元，一个月 7200 美元。保守估计。有人一个晚上因为一条命令烧了几千美元。

更深的代价是四种隐性成本：验证债务、理解腐化、认知投降、Token 失控。

◆效果惊人的实践

但用得好，效果也是惊人的。

澳大利亚开发者 Geoffrey Huntley 搞了个叫 Ralph 的东西——一套 bash 脚本，每轮把上下文重置到固定锚点文件避免腐烂。有人用它接了一个五万美元的合同，总计算成本只花了 297 美元。Huntley 自己则用这套方法跑了三个月循环，造出了一门叫 CURSED 的编程语言。

还有更硬的。前 OpenAI 创始成员 Andrej Karpathy 的 AutoResearch，整个框架约 630 行 Python 加一个 Markdown 提示文件驱动。Agent 自己改 train.py、跑五分钟、看结果、决定保留还是回滚，循环往复。两天约 700 次实验，挖出约 20 处优化——在他已经手工调优过很久的代码上。复现 GPT-2 的训练时间从 2.02 小时压到 1.80 小时，提速 11%。

连 Karpathy 亲手调过的代码，Loop 还能再挖出 20 处优化。这些优化天然需要搜索空间，人类不可能手动跑 700 次实验。Loop 不是在替代智力，是在突破人类的带宽。

Loop 是⼀个放大器。带进去判断力就放大判断力，带进去懒惰就放大懒惰。

◆两个前沿方向

Code as Agent Harness

来自 UIUC、Meta、斯坦福的 102 页综述。代码在 Harness 里不再是最终交付的产物，而是进入整个执行循环，承载计划、执行、反馈、验证和状态管理。代码有三个自然语言不具备的属性：可执行、可检查、有状态。编译错误和测试结果不会撒谎，仓库和 commit history 是真实可查的状态锚点。

Harness 的自主演化

前沿设计引入了演化控制面：Agent 执行过程中如果发现某个失败模式反复出现，系统会记录轨迹、分析根因、生成候选修改，通过独立的回归测试校验才能合入。Harness 正在从静态脚手架变成可以自我演化的系统。

行业的动作也印证了这一点。AWS 推出了 Amazon Bedrock AgentCore Managed Harness，一个完全托管的 Agent 运行时。HarnessX 通过演化引擎在五个基准测试上实现了平均 14.5% 的提升，最高达 44%。

◆从 Loop 到执行图

当 Loop 越来越复杂，还有一个值得注意的方向。纯上下文驱动的循环有一个结构性限制：下一步做什么主要靠 LLM 在上下文里判断，依赖关系不可见、恢复策略不可控、历史不断变化导致调试困难。前沿研究在探索把 Loop 升级为显式的执行图，把控制流从隐含上下文里拿出来，放到状态机和调度协议里。只要进入生产，系统最终都要求可解释、可回放、可审计。

◆写在最后

最后，回到 Boris Cherny 那句话。他说的不是「我不写代码了」，他说的是「我不写提示词了」。

这两句话的区别，就是完整的 Harness 到 Loop 的故事。过去人就是那个循环本身——你写 prompt、你看输出、你决定下一步。但现在，你把「下一步怎么产生」写进系统，你定义目标、设计验证、设置边界和预算，然后把推进过程交给 Loop。

模型决定 Agent 的上限。Harness 决定 Agent 能不能在真实环境里干活。Loop 决定这个系统能不能自己持续转起来。

如果你也在做 Agent 相关的开发，我的建议很朴素。花点时间看看你的 Harness——执行环境是不是安全可恢复、上下文是不是喂对了信息、验证是不是独立的、不会让干活的人自己打分。然后从一个小 Loop 开始——文档链接检查、CI 失败分流、依赖升级预检查。先跑稳一个，再说别的。

把 Loop 搭起来，但要像一个打算继续当工程师的人那样搭，不要像一个只想按下启动键的人那样搭。

你可以外包你的思考，但你没法外包你的理解。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个关注哦～

谢谢你看我的文章，我们，下次再见。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：观雪安全阿珍阿珍《从 Harness 到 Loop，Agent 战场已不在模型层》