文章总结: 该文档系统分析了AIAgent从Harness到Loop的技术演进,指出2026年6月LoopEngineering成为核心趋势。文档通过BorisCherny等案例说明Loop模式如何实现自主运行,详细介绍了ETCLOVG七层架构和15种Loop模式(如VerifierLoop),并强调优化Harness可使性能提升10倍。文章最后建议开发者从安全可恢复的执行环境入手,逐步构建稳定的Loop系统。
综合评分: null
文章分类: AI安全,安全开发,安全工具,安全运营,技术标准,score:87
从 Harness 到 Loop,Agent 战场已不在模型层
原创
阿珍 阿珍
观雪安全
2026年6月29日 18:20 山东
在小说阅读器读本章
去阅读
事情是这样的。
2025 年 8 月,OpenAI 搞了一场很激进的实验。从一个完全空的 Git 仓库出发,让 Codex 自己写应用逻辑、测试、CI 配置、文档,整个过程没有一行代码是人写的。最终产出了超过 100 万行代码。
但更让我震惊的是另一个人。Claude Code 的负责人 Boris Cherny,一个月提交了 259 个 PR,497 次 commit,4 万行新增,3.8 万行删除。每一行都是 Claude Code 写的。他甚至把 IDE 卸载了,因为一个月没打开过。
他说了一句话,我当时看到就头皮发麻。「我已经不给 Claude 写提示词了。我有一堆循环在跑,是它们在给 Claude 下指令、决定下一步做什么。我的工作,就是写循环。」
不是哥们,你一个做 AI 工具的人,连提示词都不写了???
今天这篇文章,我就想聊聊这件事背后的完整逻辑。从 Harness 到 Loop,AI Agent 到底经历了什么。
◆先说 Harness
LangChain 给了一个特别干净的表达:Agent = Model + Harness。模型负责推理和生成,Harness 是模型之外的一切——系统提示词、工具调用接口、沙箱环境、编排逻辑、反馈循环、观测和评估体系。
你把 Agent 想象成一个人。模型是大脑,Harness 是身体和神经系统。Mitchell Hashimoto 说得更实操:每次 Agent 犯错,你就设计一个方案让它未来不再犯同样的错。Harness Engineering 说到底,就是踩坑之后修出来的护栏。
但 Harness 只是第一步。
◆Loop 的诞生
回到 Boris Cherny。他为什么不再写提示词了?因为如果每一轮都需要人去评估输出、告诉它下一步做什么,人才是真正的瓶颈。他需要的是一套让 Agent 自己转起来的系统。这就是 Loop。
Harness 决定了 Agent 在什么环境跑、有哪些工具、怎么管权限、怎么记状态。Loop 决定了反馈怎么进入下一步——做了一步,验证过了继续,没过就修了再来,撞上预算就停。人是规则的制定者,不再是每一步的推动者。
◆从 Prompt 到 Loop:四阶段演化
这套演化路线非常清晰。Google Cloud 的工程总监 Addy Osmani 把这事儿总结成了四个阶段。
2022 到 2024 年,Prompt Engineering。 核心问题就一个:怎么把指令表达清楚。
2025 年,重心变成了 Context Engineering。 你光给提示词不够,还得管模型能看见什么。
2026 年 3 月,Harness Engineering 被正式提出来。 CMU、耶鲁、亚马逊梳理了 170 多个开源项目,提出了 ETCLOVG 七层架构——执行环境、工具接口、上下文管理、生命周期编排、可观测性、验证、治理。缺一层都跑不稳。
然后到了 6 月,Loop Engineering 爆了。 开源项目 OpenClaw 的创建者 Peter Steinberger 发了条推文,大意是「你不该再写提示词了,你该设计循环去提示它们」。800 万浏览。紧接着 Boris Cherny 跟进,圈内也开始流传「Nobody writes prompts anymore」的说法。Osmani 写博客正式命了名。一夜之间,Loop 成了整个 AI 圈最火的话题。
四个阶段不是替代,是层层叠加:Prompt 告诉你问什么,Context 告诉你喂什么,Harness 告诉你搭什么环境,Loop 告诉你这个环境怎么自己转起来。
◆Harness 到底有多重要
先看几组数据:
同一款模型,只优化 Harness 层,不改模型权重,Terminal-Bench 2.0 准确率从 52.8% 干到 66.5%。只改工具格式和工具 Harness,不改模型,编码任务性能最高提升 10 倍。只改 Harness 设计,编码基准测试分数从 6.7% 飙到 68.3%。
说真的,我自己用不同 Agent 产品的时候感受非常直观。同一个 Claude 模型,放进 Cursor 和放进 Claude Code,表现就是不一样。不是模型变了,是外面那层壳变了。
◆ETCLOVG 七层架构
这个框架真正的价值,不是列了七个名字,而是把可观测性和治理作为独立的架构层看待。没有可观测性,故障无从排查。没有治理,再好的 Agent 也不敢放生产环境。
聊几个关键的层:
E 层——执行环境。 Agent 在 Docker 容器或隔离的 microVM 里跑,配了渐进式权限——高风险操作要先校验输入、再查权限、再走拦截、最后还要用户确认,任一步没过就短路返回。
C 层——上下文管理。 不是把所有信息塞进去,而是分层组织。项目规范放 AGENTS.md,角色定义放 SOUL.md,用户偏好放 USER.md,模型每轮只拿跟当前任务相关的信息。
L 层——生命周期编排。 是 ETCLOVG 里项目最多的一层,47 个。前沿设计引入了显式状态机来管理流程,每个状态之间有明确的转移条件和异常处理路径,不靠模型凭感觉决策。
V 层——验证。 是整个 Loop 体系的核心,下面讲 Verifier Loop 的时候会具体展开。
◆十五种 Loop 模式
很多人第一反应是:这不就是 Agent 本来就有的 ReAct 循环吗?思考、行动、观察、再思考,炒冷饭?
没错,Agent 从来不缺循环。ReAct 2022 年就提出来了。但 2026 年的 Loop Engineering 跟它的最大区别在于:任务变长了,而且变复杂了。过去一轮对话就能解决,现在任务变成几十分钟、几小时,甚至跨天运行。这时候模型自己说「我完成了」没有意义——你需要一套独立的验证体系、硬性停止条件、可持久化的状态、能在失败后恢复的协议。
社区在过去 30 天跑出了 15 种 Loop 模式,我挑三个最值得关注的。
Verifier Loop
Boris Cherny 的方法:Claude Code 跑主任务,再配一个更强的模型做 review,再加一个独立的 verifier。核心逻辑就一条:不要让干活的人自己给自己打分。没有 verifier 的 Loop,只是 Agent 自己说服自己「我做完了」。
Anti-Spin Loop
在 Loop 里显式加入反空转停止器:没有进展就停,重复尝试同一种失败方法就停,在两个错误方向之间来回 flip-flop 就停,超预算就停。真正的问题从来不是跑得不够多,而是跑得没意义。
Completion Contract
在执行之前先写出什么才算完成、每一条 requirement 对应什么证据。没有证据就不准声称完成。相当于在动手之前先签验收合同。
◆Loop 的真实成本
你可能觉得这些听起来很有道理,但我也想跟你分享代价。Loop 的真实成本是这波热潮里最被低估的话题。
一分钟间隔跑八个小时,480 次调用,Claude Sonnet 中等上下文一次大概 0.5 美元。一天 240 美元,一个月 7200 美元。保守估计。有人一个晚上因为一条命令烧了几千美元。
更深的代价是四种隐性成本:验证债务、理解腐化、认知投降、Token 失控。
◆效果惊人的实践
但用得好,效果也是惊人的。
澳大利亚开发者 Geoffrey Huntley 搞了个叫 Ralph 的东西——一套 bash 脚本,每轮把上下文重置到固定锚点文件避免腐烂。有人用它接了一个五万美元的合同,总计算成本只花了 297 美元。Huntley 自己则用这套方法跑了三个月循环,造出了一门叫 CURSED 的编程语言。
还有更硬的。前 OpenAI 创始成员 Andrej Karpathy 的 AutoResearch,整个框架约 630 行 Python 加一个 Markdown 提示文件驱动。Agent 自己改 train.py、跑五分钟、看结果、决定保留还是回滚,循环往复。两天约 700 次实验,挖出约 20 处优化——在他已经手工调优过很久的代码上。复现 GPT-2 的训练时间从 2.02 小时压到 1.80 小时,提速 11%。
连 Karpathy 亲手调过的代码,Loop 还能再挖出 20 处优化。这些优化天然需要搜索空间,人类不可能手动跑 700 次实验。Loop 不是在替代智力,是在突破人类的带宽。
Loop 是⼀个放大器。带进去判断力就放大判断力,带进去懒惰就放大懒惰。
◆两个前沿方向
Code as Agent Harness
来自 UIUC、Meta、斯坦福的 102 页综述。代码在 Harness 里不再是最终交付的产物,而是进入整个执行循环,承载计划、执行、反馈、验证和状态管理。代码有三个自然语言不具备的属性:可执行、可检查、有状态。编译错误和测试结果不会撒谎,仓库和 commit history 是真实可查的状态锚点。
Harness 的自主演化
前沿设计引入了演化控制面:Agent 执行过程中如果发现某个失败模式反复出现,系统会记录轨迹、分析根因、生成候选修改,通过独立的回归测试校验才能合入。Harness 正在从静态脚手架变成可以自我演化的系统。
行业的动作也印证了这一点。AWS 推出了 Amazon Bedrock AgentCore Managed Harness,一个完全托管的 Agent 运行时。HarnessX 通过演化引擎在五个基准测试上实现了平均 14.5% 的提升,最高达 44%。
◆从 Loop 到执行图
当 Loop 越来越复杂,还有一个值得注意的方向。纯上下文驱动的循环有一个结构性限制:下一步做什么主要靠 LLM 在上下文里判断,依赖关系不可见、恢复策略不可控、历史不断变化导致调试困难。前沿研究在探索把 Loop 升级为显式的执行图,把控制流从隐含上下文里拿出来,放到状态机和调度协议里。只要进入生产,系统最终都要求可解释、可回放、可审计。
◆写在最后
最后,回到 Boris Cherny 那句话。他说的不是「我不写代码了」,他说的是「我不写提示词了」。
这两句话的区别,就是完整的 Harness 到 Loop 的故事。过去人就是那个循环本身——你写 prompt、你看输出、你决定下一步。但现在,你把「下一步怎么产生」写进系统,你定义目标、设计验证、设置边界和预算,然后把推进过程交给 Loop。
模型决定 Agent 的上限。Harness 决定 Agent 能不能在真实环境里干活。Loop 决定这个系统能不能自己持续转起来。
如果你也在做 Agent 相关的开发,我的建议很朴素。花点时间看看你的 Harness——执行环境是不是安全可恢复、上下文是不是喂对了信息、验证是不是独立的、不会让干活的人自己打分。然后从一个小 Loop 开始——文档链接检查、CI 失败分流、依赖升级预检查。先跑稳一个,再说别的。
把 Loop 搭起来,但要像一个打算继续当工程师的人那样搭,不要像一个只想按下启动键的人那样搭。
你可以外包你的思考,但你没法外包你的理解。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个关注哦~
谢谢你看我的文章,我们,下次再见。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:观雪安全 阿珍 阿珍《从 Harness 到 Loop,Agent 战场已不在模型层》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论