文章总结: 文章提出AIAgent发展进入下半场,核心观点包括:从’Justdoit’进化为’Don’tjustdoit.Getit’强调结果导向;Code-use范式已成共识,形成’1个Code-useAgent+多个Skills’格局;下半场范式应为自动总结生成Skills并分发;Cli+/h是最佳Skills形式;从ToolCalling转向EnvironmentActing。作者认为关键是通过ContextEngineering让环境可计算化,真正解决实际问题而非停留在验证可行性阶段。 综合评分: 84 文章分类: AI安全,安全建设,技术标准,安全工具,解决方案
AI Agent 下半场
原创
heige heige
黑哥虾撩
2026年3月10日 17:06 美国
1、Don’t just do it. Get it.
结合 2023 年 2024 年的各种忽悠经历,在 2025 年推出了《黑哥尔模型三定律》
第一定律:相信相信的力量(信念觉醒)第二定律:相信大模型的能力(认知觉醒)第三定律:Just do it [整就牛] (行动觉醒)
但是通过观察,也出现了很多“矫枉过正”的问题,过度相信大模型的能力,甚至沉迷于幻觉等情况的出现,这里没有特指而是说普遍存在,包括一些老板、有着技术情结的老玩家,有 AI 加持后,觉得所有的技术变得廉价了,不值钱了,你能干的我都能干 …
我这里不是要推翻之前的《黑哥尔模型三定律》,而是在强调:“第三定律:Just do it [整就牛] (行动觉醒)” ,只有去真正去“do”了,才能尽可能的“实事求是”。所以在“下半场”我觉得可以把“Just do it”进化一下“Don’t just do it. Get it.”
很多时候,大家现在接触大模型更多的是焦虑带来的各种跟风,而实际应用到工作生活中的真正有价值的场景实际挖掘可能还不是特别的多,当然这个是一个复杂的多因素决定的,目前大家用对最多的从 Chat 的时代“你好你是谁”,到 Agent 时代的“帮我查下天气” …
对于技术研究,很多时候都点到为止,验证可行性就算完结了,而我觉得这个在“下半场”不能满足了,不能只是“点到为止”/“浅尝浅止”了,是时候也结果说话了~~
2、Code-use 范式已成共识
在 2025 年我们通过 AiPy 推出了“Python-use”范式,本质就是 Code-use 范式,并率先打出了”No Agents, Code is Agent.”,在差不多一年时间过后,随着Anthropic通过 Claude Code 工程化实现的过程,并逐渐“觉醒”了”Code is all you need” 、 “Code is the universal interface”的认知,工程化实践也从 MCP –> PTC –> Skills 的进化而转变,Anthropic也因为他巨大的话语权及影响力,由此形成了“1 个Code-use 的范式 Agent + 多个Skills” 的基本共识和格局,也就是所谓的:“The future of AI isn’t more agents—it’s one universal agent powered by a library of domain-specific skills.”
在之前我很多次文章里都表达过,Skills 其实是在 Code-use 范式 觉醒后的,自然而然的产物,在当时 AiPy 实现的时候我们称为 “最佳实践”,在词意理解上还是非常接近“技能”的,只是Anthropic按照Claude code 等的工程实践结果,提出了一个相对宽松的结构化“标准” (这些内容都可以参考我之前的文章)
在我的视角不管是“最佳实践”还是“Skills”他本质还是“提示词工程”,所以 Skills 本质是一个相对结构化的“提示词工程”,是的Anthropic绕来绕去又回到了2023 年大模型刚火的那个阶段的“提示词工程”
而在工程化实现角度上看 卡帕西在 2025 年提出的“Context Engineering” 可能更加适合从整体上理解这个问题。当然里面可能涉及的对象不一样比如 Agent 的工程化开发,而 Skills 的开发偏向于社区 …
不管是“提示词工程”还是“上下文工程”,这些都是现有大语言模型的本身结构决定的,在 GPT(Generative Pre-trained Transformer) 原本的范式结构里,Prompt 是不可缺少的,因为 GPT 本质是“已有上下文”去预测下一个 token,所以没有输入上下文,它就没有明确的生成条件。所以在现有大语言模型基础架构就决定了“上下文工程”,而这个成为大语言模型与“环境”交互的枢纽空间。
在这里我不得不再提一下这个图:
所以以至于我认为:“2026 AI Agent 的核心:Context Engineering,让环境可计算化” 也是基于这方面的考虑。
3、“下半场”范式:自动总结生成 Skills并分发
过度的开发者依赖不符合 AGI 的追求
「当然他还拥有任务理解规划、代码最佳实践方案、记忆管理注意力调整、任务反思反馈的能力,甚至我们认为通过Python Use这种范式,可以让各种AI章鱼和谐统一的为人类工作(类“MOE”模式),甚至可以让AI章鱼的自我进化,不只是手和脚,可以促进眼睛、鼻子、嘴巴等多模态能力的进化!最终实现AGI,这才是真正的“智能体”。」
解放 AI 是 AiPy 的追求:
“No Agents, Code is Agent <--> Just Python-use <--> Freedom AI”
这个也是符合黑哥尔三定律里的相信模型的能力,所以我之前对待 MCP 的态度,提倡 “No MCP”,因为MCP 有个问题依赖开发者的开发,而这个显然是不符合 AGI 的追求的,而 Skills 的爆火后同样存在这个问题,当然在大部分的时候相比 MCP 已经降低了不少“开发”门槛,不过还是看到不少资深开发者把核心放在 Skills 里的Script 的开发,而这样同样需要门槛。如果你过度去追求 Script 的复杂开发,显然这个又回归到 MCP 的老问题上了!
所以在“下半场”的范式应该是:
Code-use Agent –> 任务 –> 自动总结生成并安装 Skills –> 分发 到 Skills 市场 –> 其他用户下载安装使用
4、Cli + /h 或许是最好的 Skills
到现在为止其实我还是觉得我们的 AiPy CLi 的设计的兼容性和可扩展性是非常强大的,可惜的是可能关注的人不是特别多,比如 “API Calling” 的设计,你基本上就能扩展很多的互联网服务及很多的其他能提供 API 接口的设备联动,设置多模型联动等(具体可以参考《AI Agent真正落地的关键:大模型与环境数据的无限扩展能力》)当然还有一个点就是 “Packages Calling” 这里本身就有海量的Packages 重要的还有很多的本地小模型都提供对应的Package方便我们处理,当然也包括“当你有需求你开发一个包,调用就行了”,而 Pyhon 的包本事就能提供 Cli 执行,在这个角度上看,你开发一个复杂的 MCP 或者 SKills 里的复杂的脚本,实际上你不如直接开发一个 Python 包,当然在之前我朋友圈提到的 https://github.com/teng-lin/notebooklm-py 这个项目,他其实就是开发了一个 py 包 …
老黑客们都知道写的命令行工具都有个/h或者-h 的参数,来说明这个这个脚本或者工具的用途,当然一些变态的老黑客例外,所以其实包含脚本的这类 skills 写的 skill.md 无非是告诉你怎么调用这些脚本,如果你在实现命令行工具的时候加个/h 参数 那么你的 Skills 将变得非常简单明确。
比如之前我在使用 AiPy 对纯血鸿蒙的 hdc 接口进行 fuzzing 测试的时候用的提示词就是:
“现在你已经usb拦截我的手机,我的手机是华为鸿蒙系统,是通过hdc shell进行管理,但是这个是一个全新的手机,我需要你去通过在help -a命令来找到各种命令、子命令及参数,然后对所有系统命令及子命令进行随机fuzzing测试。”
按这个逻辑我们继续走下去,你会发现如果所有的东西都有 cli +/h 支持,那么上文提到的“1 个Code-use 的范式 Agent”,实际上就可以用一个“Base-use”的 Agent 替代,当然这个还得考虑操作系统等因素。
5、从 Tool Calling 到 Environment Acting
在“2、Code-use 范式已成共识”明确后,我觉得大模型尝试可能不再过分追求 Function/Tool Calling,包括之前打榜的基准测试,而是“训练目标的重心,可能正在从‘会不会调工具’转向‘能不能在环境里把事做完’”,这个也是我之前文章里提到的“Context Engineering”模型端做的尝试努力,比如更智能的“记忆”、对 Skills 的更好理解与调用、更顺畅的注意力组织与上下文聚焦、更丝滑地处理长链路/复杂任务,在真实环境中持续执行、反馈、修正并完成目标等方向上的训练。
小结
之所以用“下半场”这个词,是致敬姚顺雨的之前写过很火的文章《The Second Half》
https://ysymyth.github.io/The-Second-Half/
当然我这个是说 AI Agent的下半场,到下半场我们应该真正看中的是结果,通过 AI 的融合或者重塑,真正在你的工作生活中解决实际有价值的问题,当然今天这篇文章还有一个重要点没有展开,那就是“性价比”的问题,如果要真正结果导向“性价比”的问题就是绕不开的一个问题。
最后还有一个问题就是“龙虾”的火爆,虽然我感觉很邪门(参考神龙叫《龙虾?宗教、钱财、骗子》),但是它可能是加速AI Agent 进入“下半场”~~ 从流量游戏转为真正干活牛马~~
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:黑哥虾撩 heige heige《AI Agent 下半场》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论