【01AI重力场】模型越来越强,为什么大家却只看好Harness

admin 2026-04-02 04:52:39 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文探讨了AI工程重心的转变,即从提升模型能力转向确保系统稳定交付结果。文章指出,Harness并非模型的简单包装,而是连接模型与工程世界的控制系统,它能解决模型在长任务中因缺乏状态管理、约束理解和反馈机制而导致的稳定性问题。其核心价值在于将隐性约束显性化、缩小解空间并构建生成-反馈的闭环。文章最后为个人开发者和团队提供了五项实战建议,强调先通过清晰的规则和单Agent系统解决问题,再逐步复杂化。 综合评分: 85 文章分类: AI安全,安全开发,技术标准,解决方案,安全运营


cover_image

【01 AI重力场】模型越来越强,为什么大家却只看好 Harness

原创

陈看山 陈看山

安全诸子

2026年3月29日 08:52 上海

模型越来越强,为什么大家却开始重写 Harness

AI 工程的重心,正在从”让模型更会回答”,转向”让系统更稳地交付结果”。

核心观点

过去两年,我们讨论 AI,讨论得最多的是模型本身——模型够不够强,上下文够不够长,推理有没有提升。

但现在,如果你真的开始让 Agent 写代码、读仓库、跑测试、调浏览器、修 CI,你很快就会发现:拖后腿的往往不是能力,是稳定性。它会跑偏,会以为自己做完了,会在你没注意的地方悄悄变形。

而这些问题,大多发生在模型外面。

Harness 不是一层”壳”

很多人第一次听到 Harness,会本能地把它理解成”模型外面那层包装”。

但如果只是为了做一个短对话应用,你确实可以把它理解成包装层。一个聊天窗口,加一个消息循环,再加几个工具,差不多也能跑起来。

一旦任务开始变长,事情就不是”包一层”这么简单了。

模型自己不会保存状态,不会主动维护工作目录,不会判断某次输出是不是已经满足了系统约束,也不会天然知道什么时候该停、什么时候该继续、什么时候该回滚。

所以更准确的理解是:Harness 是把模型接进工程世界的控制系统

三个关键层次

如果把最近几篇热门文章放在一起看,会发现它们其实都在补模型外面的系统层:

| 文章 | 解决的问题 | 对应层次 | | — | — | — | | 《跟Cloudflare大佬学用 Claude Code》 | 架构决策怎么进入执行流程 | 流程层 | | 《Skills 详解》 | 提示词漂移、方法失传 | 知识层 | | 《深度拆解 OpenClaw 架构》 | 队列、权限、回放、语义快照 | 运行时层 |

Harness 值钱的三个能力

1. 把隐性约束写出来

人类工程师在团队里工作,很多判断其实不写在代码里——哪些模块不能碰,哪些目录是只读的,哪些测试不过就别谈合并。

模型没有这些经验。所以你越希望它长期工作,就越要把这些知识推到文件系统里,推到规则里,推到工具可见性里。

2. 缩小解空间

工具太多,它开始犹豫。上下文太满,它开始退化。边界太松,它会在错误方向上越跑越远。

更有效的 Harness,往往是把路修得越来越清楚,而不是越来越宽

3. 把”生成”改造成”闭环”

真实工作是一个循环:读上下文,做判断,执行动作,观察结果,修正方向,再继续。

如果没有日志、测试、浏览器、Lint、评审规则这些反馈点,模型的生成能力再强,也很容易停在”看起来差不多”。

实战建议:先补这五样

如果你是个人开发者,或者是刚开始让 Agent 真正进入工作流的团队:

1. 统一知识入口

仓库里该有的东西尽量放进仓库。架构约定、目录说明、关键约束、计划文件,都尽量文件化。

2. 指令文件短一点

AGENTS.mdCLAUDE.md 这类文件有用,但别写成一部长篇制度手册。它更适合告诉模型”去哪看什么”。

3. 能靠硬约束解决的,就别只靠 Prompt

架构边界、目录限制、测试要求、Lint 规则,这些如果能自动检查,就不要只写一句”请遵守”。

模型会忘,规则不会。

4. 给它反馈,不要只给它任务

写完代码之后,它应该能看到测试结果、浏览器表现、日志、错误提示。

5. 别急着上多 Agent

很多问题,单 Agent 加清晰约束就能解决。多 Agent 会把状态同步、职责边界、上下文漂移这些问题一起放大。

写在最后

Harness 不是一套固定答案,它更像一类持续移动的问题。

上下文总得管理、环境总得约束、结果总得验证、失败总得反馈、知识总得沉淀——这些问题不会随着某一代模型升级就消失。

模型变强,变化的更像是”问题出现的位置”。以前你要花很多力气教它怎么保持上下文一致性;以后也许这件事轻了,但你会开始让它跑更长的任务、接更复杂的系统、承担更高的自主权。

模型把可能性打开,系统再决定这些可能性能不能落成稳定结果。


*本文参考自架构师公众号,有删改和重新组织*


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:安全诸子 陈看山 陈看山《【01 AI重力场】模型越来越强,为什么大家却只看好 Harness》

评论:0   参与:  0