从Harness到Loop,Agent战场已不在模型层

admin 2026-07-01 05:08:14 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 该文档系统分析了AIAgent从Harness到Loop的技术演进,指出2026年6月LoopEngineering成为核心趋势。文档通过BorisCherny等案例说明Loop模式如何实现自主运行,详细介绍了ETCLOVG七层架构和15种Loop模式(如VerifierLoop),并强调优化Harness可使性能提升10倍。文章最后建议开发者从安全可恢复的执行环境入手,逐步构建稳定的Loop系统。 综合评分: null 文章分类: AI安全,安全开发,安全工具,安全运营,技术标准,score:87


cover_image

从 Harness 到 Loop,Agent 战场已不在模型层

原创

阿珍 阿珍

观雪安全

2026年6月29日 18:20 山东

在小说阅读器读本章

去阅读

事情是这样的。

2025 年 8 月,OpenAI 搞了一场很激进的实验。从一个完全空的 Git 仓库出发,让 Codex 自己写应用逻辑、测试、CI 配置、文档,整个过程没有一行代码是人写的。最终产出了超过 100 万行代码。

但更让我震惊的是另一个人。Claude Code 的负责人 Boris Cherny,一个月提交了 259 个 PR,497 次 commit,4 万行新增,3.8 万行删除。每一行都是 Claude Code 写的。他甚至把 IDE 卸载了,因为一个月没打开过。

他说了一句话,我当时看到就头皮发麻。「我已经不给 Claude 写提示词了。我有一堆循环在跑,是它们在给 Claude 下指令、决定下一步做什么。我的工作,就是写循环。」

不是哥们,你一个做 AI 工具的人,连提示词都不写了???

今天这篇文章,我就想聊聊这件事背后的完整逻辑。从 Harness 到 Loop,AI Agent 到底经历了什么。

◆先说 Harness

LangChain 给了一个特别干净的表达:Agent = Model + Harness。模型负责推理和生成,Harness 是模型之外的一切——系统提示词、工具调用接口、沙箱环境、编排逻辑、反馈循环、观测和评估体系。

你把 Agent 想象成一个人。模型是大脑,Harness 是身体和神经系统。Mitchell Hashimoto 说得更实操:每次 Agent 犯错,你就设计一个方案让它未来不再犯同样的错。Harness Engineering 说到底,就是踩坑之后修出来的护栏。

但 Harness 只是第一步。

◆Loop 的诞生

回到 Boris Cherny。他为什么不再写提示词了?因为如果每一轮都需要人去评估输出、告诉它下一步做什么,人才是真正的瓶颈。他需要的是一套让 Agent 自己转起来的系统。这就是 Loop。

Harness 决定了 Agent 在什么环境跑、有哪些工具、怎么管权限、怎么记状态。Loop 决定了反馈怎么进入下一步——做了一步,验证过了继续,没过就修了再来,撞上预算就停。人是规则的制定者,不再是每一步的推动者。

◆从 Prompt 到 Loop:四阶段演化

这套演化路线非常清晰。Google Cloud 的工程总监 Addy Osmani 把这事儿总结成了四个阶段。

2022 到 2024 年,Prompt Engineering。 核心问题就一个:怎么把指令表达清楚。

2025 年,重心变成了 Context Engineering。 你光给提示词不够,还得管模型能看见什么。

2026 年 3 月,Harness Engineering 被正式提出来。 CMU、耶鲁、亚马逊梳理了 170 多个开源项目,提出了 ETCLOVG 七层架构——执行环境、工具接口、上下文管理、生命周期编排、可观测性、验证、治理。缺一层都跑不稳。

然后到了 6 月,Loop Engineering 爆了。 开源项目 OpenClaw 的创建者 Peter Steinberger 发了条推文,大意是「你不该再写提示词了,你该设计循环去提示它们」。800 万浏览。紧接着 Boris Cherny 跟进,圈内也开始流传「Nobody writes prompts anymore」的说法。Osmani 写博客正式命了名。一夜之间,Loop 成了整个 AI 圈最火的话题。

四个阶段不是替代,是层层叠加:Prompt 告诉你问什么,Context 告诉你喂什么,Harness 告诉你搭什么环境,Loop 告诉你这个环境怎么自己转起来。

◆Harness 到底有多重要

先看几组数据:

同一款模型,只优化 Harness 层,不改模型权重,Terminal-Bench 2.0 准确率从 52.8% 干到 66.5%。只改工具格式和工具 Harness,不改模型,编码任务性能最高提升 10 倍。只改 Harness 设计,编码基准测试分数从 6.7% 飙到 68.3%

说真的,我自己用不同 Agent 产品的时候感受非常直观。同一个 Claude 模型,放进 Cursor 和放进 Claude Code,表现就是不一样。不是模型变了,是外面那层壳变了。

◆ETCLOVG 七层架构

这个框架真正的价值,不是列了七个名字,而是把可观测性和治理作为独立的架构层看待。没有可观测性,故障无从排查。没有治理,再好的 Agent 也不敢放生产环境。

聊几个关键的层:

E 层——执行环境。 Agent 在 Docker 容器或隔离的 microVM 里跑,配了渐进式权限——高风险操作要先校验输入、再查权限、再走拦截、最后还要用户确认,任一步没过就短路返回。

C 层——上下文管理。 不是把所有信息塞进去,而是分层组织。项目规范放 AGENTS.md,角色定义放 SOUL.md,用户偏好放 USER.md,模型每轮只拿跟当前任务相关的信息。

L 层——生命周期编排。 是 ETCLOVG 里项目最多的一层,47 个。前沿设计引入了显式状态机来管理流程,每个状态之间有明确的转移条件和异常处理路径,不靠模型凭感觉决策。

V 层——验证。 是整个 Loop 体系的核心,下面讲 Verifier Loop 的时候会具体展开。

◆十五种 Loop 模式

很多人第一反应是:这不就是 Agent 本来就有的 ReAct 循环吗?思考、行动、观察、再思考,炒冷饭?

没错,Agent 从来不缺循环。ReAct 2022 年就提出来了。但 2026 年的 Loop Engineering 跟它的最大区别在于:任务变长了,而且变复杂了。过去一轮对话就能解决,现在任务变成几十分钟、几小时,甚至跨天运行。这时候模型自己说「我完成了」没有意义——你需要一套独立的验证体系、硬性停止条件、可持久化的状态、能在失败后恢复的协议。

社区在过去 30 天跑出了 15 种 Loop 模式,我挑三个最值得关注的。

Verifier Loop

Boris Cherny 的方法:Claude Code 跑主任务,再配一个更强的模型做 review,再加一个独立的 verifier。核心逻辑就一条:不要让干活的人自己给自己打分。没有 verifier 的 Loop,只是 Agent 自己说服自己「我做完了」。

Anti-Spin Loop

在 Loop 里显式加入反空转停止器:没有进展就停,重复尝试同一种失败方法就停,在两个错误方向之间来回 flip-flop 就停,超预算就停。真正的问题从来不是跑得不够多,而是跑得没意义。

Completion Contract

在执行之前先写出什么才算完成、每一条 requirement 对应什么证据。没有证据就不准声称完成。相当于在动手之前先签验收合同。

◆Loop 的真实成本

你可能觉得这些听起来很有道理,但我也想跟你分享代价。Loop 的真实成本是这波热潮里最被低估的话题

一分钟间隔跑八个小时,480 次调用,Claude Sonnet 中等上下文一次大概 0.5 美元。一天 240 美元,一个月 7200 美元。保守估计。有人一个晚上因为一条命令烧了几千美元。

更深的代价是四种隐性成本:验证债务、理解腐化、认知投降、Token 失控

◆效果惊人的实践

但用得好,效果也是惊人的。

澳大利亚开发者 Geoffrey Huntley 搞了个叫 Ralph 的东西——一套 bash 脚本,每轮把上下文重置到固定锚点文件避免腐烂。有人用它接了一个五万美元的合同,总计算成本只花了 297 美元。Huntley 自己则用这套方法跑了三个月循环,造出了一门叫 CURSED 的编程语言。

还有更硬的。前 OpenAI 创始成员 Andrej Karpathy 的 AutoResearch,整个框架约 630 行 Python 加一个 Markdown 提示文件驱动。Agent 自己改 train.py、跑五分钟、看结果、决定保留还是回滚,循环往复。两天约 700 次实验,挖出约 20 处优化——在他已经手工调优过很久的代码上。复现 GPT-2 的训练时间从 2.02 小时压到 1.80 小时,提速 11%

连 Karpathy 亲手调过的代码,Loop 还能再挖出 20 处优化。这些优化天然需要搜索空间,人类不可能手动跑 700 次实验。Loop 不是在替代智力,是在突破人类的带宽

Loop 是⼀个放大器。带进去判断力就放大判断力,带进去懒惰就放大懒惰。

◆两个前沿方向

Code as Agent Harness

来自 UIUC、Meta、斯坦福的 102 页综述。代码在 Harness 里不再是最终交付的产物,而是进入整个执行循环,承载计划、执行、反馈、验证和状态管理。代码有三个自然语言不具备的属性:可执行、可检查、有状态。编译错误和测试结果不会撒谎,仓库和 commit history 是真实可查的状态锚点。

Harness 的自主演化

前沿设计引入了演化控制面:Agent 执行过程中如果发现某个失败模式反复出现,系统会记录轨迹、分析根因、生成候选修改,通过独立的回归测试校验才能合入。Harness 正在从静态脚手架变成可以自我演化的系统。

行业的动作也印证了这一点。AWS 推出了 Amazon Bedrock AgentCore Managed Harness,一个完全托管的 Agent 运行时。HarnessX 通过演化引擎在五个基准测试上实现了平均 14.5% 的提升,最高达 44%。

◆从 Loop 到执行图

当 Loop 越来越复杂,还有一个值得注意的方向。纯上下文驱动的循环有一个结构性限制:下一步做什么主要靠 LLM 在上下文里判断,依赖关系不可见、恢复策略不可控、历史不断变化导致调试困难。前沿研究在探索把 Loop 升级为显式的执行图,把控制流从隐含上下文里拿出来,放到状态机和调度协议里。只要进入生产,系统最终都要求可解释、可回放、可审计。

◆写在最后

最后,回到 Boris Cherny 那句话。他说的不是「我不写代码了」,他说的是「我不写提示词了」

这两句话的区别,就是完整的 Harness 到 Loop 的故事。过去人就是那个循环本身——你写 prompt、你看输出、你决定下一步。但现在,你把「下一步怎么产生」写进系统,你定义目标、设计验证、设置边界和预算,然后把推进过程交给 Loop。

模型决定 Agent 的上限。Harness 决定 Agent 能不能在真实环境里干活。Loop 决定这个系统能不能自己持续转起来。

如果你也在做 Agent 相关的开发,我的建议很朴素。花点时间看看你的 Harness——执行环境是不是安全可恢复、上下文是不是喂对了信息、验证是不是独立的、不会让干活的人自己打分。然后从一个小 Loop 开始——文档链接检查、CI 失败分流、依赖升级预检查。先跑稳一个,再说别的。

把 Loop 搭起来,但要像一个打算继续当工程师的人那样搭,不要像一个只想按下启动键的人那样搭。

你可以外包你的思考,但你没法外包你的理解。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个关注哦~

谢谢你看我的文章,我们,下次再见。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:观雪安全 阿珍 阿珍《从 Harness 到 Loop,Agent 战场已不在模型层》

评论:0   参与:  0