文章总结: 文章认为AIAgent运行时基座技术已成熟,重点转向产品形态竞争。作者回顾了从模型能力提升、协议标准发展到OpenClaw抽象出Agent运行时的演进过程,指出运行时内核可脱离终端窗口束缚,嵌入CLI、GUI、SaaS等不同场景。当前市场呈现多元化形态,包括云端任务容器、用户独占环境及AI硬件集成,但尚无统一交互范式能通吃所有场景。 综合评分: 70 文章分类: AI安全,安全工具,技术标准,解决方案,安全开发
Agent运行时基座已成,现在是产品形态之争的时代
原创
尼克劳斯 尼克劳斯
尼克劳斯
2026年5月28日 18:28 广东
在小说阅读器读本章
去阅读
突然来了灵感,这句总结很帅:Agent 运行时基座已成。
今天把这感知简单梳理一下。
回头来看,过去两年,这个行业在干什么呢?
从模型自身的发展,包括多模态、性能以及核心的内化推理能力,到封闭的各家在模型之上应用层的加工,也就是在 AIChat 上去堆叠单点 Agent 能力,什么插入图片、上传文件、展开画布编辑、修改图片、项目组织、网页搜索之类的。
到开放的协议标准发展互操作性,MCP、APC 之类的,生态上搞定了工具接入调用、Skills、浏览器使用、桌面使用、Code is Everything 随时生成工具执行、Memory 等等大头。
另一个维度上,最开始的 AI Chat App 发展到综合型 AI 助手 App,覆盖 Web、手机端、电脑端、手表端、车机端等嵌入式领域,MCP 服务器疯狂调用,各种 Agent 单点互调,IDE AI 化。
到 Claude Code CLI 形态自由不羁做软件工程并“扩展”成通用 Agent 运行时,理解意图、拆解任务、调度工具、执行动作、验证结果、 记忆管理、权限控制、长程状态保持、跨工具编排,这些原本散落在各处的基建,现在被收敛成了一个可以独立存在的“运行时内核”,所谓的 Harness,AI 工程控制化整体。
但此时 Agent 运行时未被冠名。根本没有人在提这个抽象。
直到 OpenClaw 龙虾出现,并且偷走革命胜利的果实。
ECS 云服务器部署龙虾、个人电脑部署龙虾接入各种 IM、AI 助手接入龙虾执行模式、开发版小硬件直接接入龙虾卖硬件盒子……
全民龙虾舆论场激发,已经让更普遍的世人认为龙虾就是 AI 之神。OpenClaw 已经将 Agent 运行时抽象了出来。
(我今天才发现 Agent Runtime 这词已经写在 OpenClaw 文档里了,自己抽象出了这么一个完全匹配的概念,也是小惊喜:D)
至于再后来所谓比 OpenClaw 更强大的 Hermes,甚至不足以载入史册,它不属于主线上的变革事物。
反过来说,也要感谢 OpenClaw,这么一来,加速了 Agent 运行时基座这个事物被抽象出来发展的进程。至少是把我灵感激发出来理解这行业的发展了。
再补充一点观察,给 OpenClaw 泼点水和点点赞。因为我一直用的 Claude Code,它的强大我是知道的,每个人学习、使用工具的能力和习惯不一样,能发挥出工具的实力本身也不一样,但是客观地说,在 OpenClaw 被吹成那样离谱的时候,我其实真的不知道使用它比 Claude Code 强在哪里,我也说不上来它怎么这么让我厌烦。
直到后边我在思考“Agent 运行时”这个概念的时候,我想通了。
首先,对比 Claude Code,OpenClaw 把 CLI 里的 Agent 运行时抽象成一种更独立、可插拔、可外放的形态,摆脱“终端窗口”这个物理接入束缚。要做行业基座,Agent 运行时就是不应该被任何单一界面绑架,它需要可以被连接、被嵌入到任何环境里。
想想我之前还尝试直接基于 Claude Code CLI,通过信息全接管的方式接入,在上层封装一个团队协作版本的 Claude Code,有够无语也挺搞笑的。
但 OpenClaw 被跑偏了。它的核心革命被引导到了接入 IM 这个交互入口上,试图用聊天框承载 Agent 运行时的能力。但连通到 IM 领域,其实不是这么肤浅的,交互产品体验、团队协作等方面才是 AI 接入 IM 的核心。
这是被全民,普通用户舆论带偏的,也不是怪它。不过我之前写的一篇文章《魔幻龙虾》屌它了,这样回头来看,有失公允和水准。
https://www.oschina.net/news/409135/wtf-openclaw
说了这么多,我的视角就是这样的,而这些信息串起来之后,对我来说就是“Agent 运行时基座已成,现在是产品形态之争的时代,也是 Agentic 真正开始市场化的时代”。
接下来要争的,是这个 Runtime 之上长什么形态。
现在有一些流行的说法,说 AI 时代 CLI 不行了、桌面 GUI 是 legacy、未来所有东西都应该搬到浏览器里做 SaaS、TUI 无敌于天下、AI 手机才是未来啥啥的。
#
前边咱们逻辑已经顺出来了,Agent 运行时是基座,那在基座之上,产品该长什么形态,肯定不是一概而论的。
#
至于在拿着 AI 就去争论一个“统一的产品形态”、“统一的使用范式”、“统一的交互范式”,我觉得一点也没意义。或者说它的意义不在于互联网技术行业范畴,不在我这个上下文。
#
上层产品形态是运行时能力的外溢,工程师需要精确控制、自主权,Agent 运行时就暴露 CLI 接口;设计师需要空间操作,运行时就驱动 GUI 画布;团队需要随时临时性打开协作,运行时就在线云端 SaaS 统筹等等。
道生万器,器无高下,适者为先。
简单说几个东西。
面向工程师,CLI + IDE,两者都被 AI 增强了,大家还是这么用。你要跟我说微信聊天搞软件工程,别惹我发笑了真的哥。
桌面 GUI 是深度工作的容器,浏览器装不下工坊,桌面死不了。桌面 GUI 的核心价值是对本地硬件资源、上下文材料、复杂状态、多模态输入(数位板、3D 鼠标、专业调色台等)、以及毫秒级响应的完全掌控。
这些需求不会因为 AI 的出现而消失,反而因为 AI 降低了创作门槛,会有更多非专业用户涌入这些专业工具,他们更需要一个可视化的、容错率高的桌面环境来兜底。
有个特别扎心的现实,云文档已经强成今天这样了,还有多少甚至是命名为互联网技术企业的,多少技术团队、产品团队、运营团队,照样用的是 WPS、Microsoft Office。甚至都不用论证,现实就是这样,AI 来都来这么久了,桌面文档的情况改变了吗?
再说了,游戏、影视等等人类文娱需求的场景呢?这想都不用想就知道,咱们还没到脑机接口、意识上传时代。
做 SaaS 化产品,现在分为一次性任务的,云端即时新开一个容器“主机”去跑这个任务。
还有直接占用容器的模式,这个容器就给用户独占了,不是基于任务粒度,而是基于用户粒度。
举个例子,打开 Kimi Web 端,Agent 模式让它做一个 PPT 交付给我,一次性容器跑完,这容器就是服务于这个任务的;而 Kimi 的云端 OpenClaw,就是用户独占,上边是你这个用户自己的一亩三分地,有可持久性。
前边在讲 OpenClaw 出来之后的市场行情,其实已经把这些形态点过了,你可见“Agent 运行时”这个独立的抽象,是多么重要。
你把 Agent 运行时整个结合硬件去做,做手机整机或者 PC 整机 AI 集成,也就是所谓的 AI PC、AI 手机,目前还处于初期发力阶段。
对于这个方向,有讨论价值的是像手机、电脑这种拥有传统的人类直接可交互入口的硬件。你跟我说搞个集成 Agent 运行时的 AI NAS,搞个家庭总控 AI 管家啥的,别,我真没讨论到那个“科幻”时代。
简单这样结束吧,每个逻辑都能往下讨论,但目前就是看不到什么形态能在 AI 的增强下通吃的。
Agent 运行时基座已成,现在是产品形态之争的时代,也是 Agentic 真正开始市场化的时代。
市场化,我最近还很喜欢的一个说法:Task as a Service(TaaS),还有按形如电费付 Token 的模式,叫它 TaaS 也没毛病吧?站在交付的角度,又何尝不能在这之上独立发展出新的产品形态呢?
btw,Agent 运行时的发生,历史回头总结的话,还会有一个很有意思的地方,这东西是从 Claude Code 这个软件工程师自身需求一步步演进出来而去变革人类生产、生活的。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:尼克劳斯 尼克劳斯 尼克劳斯《Agent运行时基座已成,现在是产品形态之争的时代》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论