2026AIAgent的核心:ContextEngineering,让环境可计算化

admin 2026-01-01 05:05:19 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文章回顾2025年作者提出的Python-use范式,主张‘NoAgents,JustCode’,以可复用Python技能替代多Agent,实现通用Agent与环境深度交互;对比AnthropicSkills、ClaudeCode、Cursor等实践,强调ContextEngineering即把对话、记忆、技能、凭证等全部可计算化,是AIAgent落地的核心;指出本地环境接口与模型能力决定上限,云端方案难成壁垒,并给出鸿蒙手机USB控制、OCR、绘图等技能示例,展望2026年LLMGUI与国产模型追赶。 综合评分: 88 文章分类: AI安全,安全开发,实战经验,解决方案,其他


而在2025年12月在豆包手机短暂火一把之后 智谱开源的

github.com/zai-org/Open-AutoGLM

 方式其实跟我当时使用的方式是一样的,只是我当时识别图片坐标的是Claude模型,当时缺少针对性的手机GUI训练的模型,效果还是非常不稳定。

在某种角度这也说明了:“模型越强,AiPy就越强的”,这个是由于Python-use范式里“Freedom AI”解放大模型最好的诠释!

在AI Agent领域,基础模型是至关重要的,这个为什么Manus大火后很多人觉得效果有很大一部分是Claude模型的功劳,而被Manus很多人藐视仅仅是“套壳”而已,并且在manuse之后大部分的Agent的创业产品都选择使用Claude等国外闭源一线模型,实际上我们的AiPy一直都是使用的国产模型,而这些包括“技能”支持的效果,实际上是非常考验模型能力的,这个也是为什么早期Skills只在Claude Code上表现好,而在其他模型上表现效果可能没有那么好也有一定相关性,万幸的是2025年国产模型发力,逐步缩小不少差距!有兴趣的可以看看AiPy以往的模型测评结果:https://www.aipyaipy.com/ (点击“测评报告”)

Andrej Karpathy – 2025 LLM Year in Review

在聊完Skiils两位缔造者的演讲后,我们再看看我们的“老朋友”Andrej Karpathy发布的2025的总结:

https://karpathy.bearblog.dev/year-in-review-2025/

Andrej Karpathy在吹火Vibe Coding后,后面他的推特基本上都会被热捧,在Vibe Coding之后他又提出了”Context Engineering”,所以在前面他写的《2025 LLM Year in Review》总结里对这些都有覆盖,他这个总结有6点,用notebooklm总结了下面三个方面:

当然我这里主要是一下交互相关的也就是Karpathy总结了的后4点,对应Vibe Coding我之前写过一篇专文《从 Vibe Coding 到 Vibe Working》 实际上我也算是最早实践者之一,而且还是在Vibe Coding这个概念提出之前,可以参考《0基础到纯血鸿蒙APP开发实践》

当然我这里其实是想强调下相比Vibe Coding,Vibe Working这个词更符合Python-use范式。

然后就是 “3. Cursor / new layer of LLM apps” Cursor是一只都有推荐的并不是2025年菜火,我觉得Karpathy之所以2025年的总结里提出是为了说明:”Context Engineering”,在目前的AI Agent的领域我觉得”Context Engineering”核心中的核心,很多的问题其实就是围绕”Context”展开的,在这里我需要说明下的是我认为的”Context Engineering”是不只是与LLM对话的上下文,而是与“环境”交互的所有内容,包括了对话过程、记忆、技能(最佳实践)、APIkey(认证凭证)及API或者其他工具说明等等

其实我在《Code是AI的手:姚顺雨访谈与Python-Use范式的对话》一文中有说明:

在这个理解层面,Cursor在代码角度确实是做的比较好的,当然我在《Code是AI的手:姚顺雨访谈与Python-Use范式的对话》已经说明过了:

实际上Anthropic提出的包括MCP、PTC、Skills甚至包括SubAgent这些都是围绕”Context Engineering”而探索的结果,我在下面这个经典的图上做个标识可能更好理解:

当然Karpathy原文里还提到了Cursor在2025年终于意识到他不只是个IDE这些问题,这个我在之前那些文章也有提到当时被IDE局限的问题,当然在上面提到的Skills两位也开始意识到Claude Code的定位问题,都是一样的…

“4. Claude Code / AI that lives on your computer”

其实我看到Karpathy的文章的时候,我第一反应就是这个第4点应该是AiPy啊,又是“羡慕嫉妒恨”大厂的时候:

这个完完全全就是AiPy的描叙,AiPy的推出比Claude Code要早,在范式角度实际上强调了本地环境的重要性和扩展性,这个理念我在《AI Agent真正落地的关键:大模型与环境数据的无限扩展能力》一文做了详细的阐述,包括我最早看到MCP的优势其实,也是在于本地环境的交互上,当然可能是这篇文章写了大量的案例导致可能关注度(阅读量)少了点。

比较有意思的Karpathy还吐槽了Codex最开始的路走错了:

“I think OpenAI got this wrong because they focused their early codex / agent efforts on cloud deployments in containers orchestrated from ChatGPT instead of simply localhost. ”

这个跟我在《从 Vibe Coding 到 Vibe Working》也提到了类似问题,当然最早在《【Agents/MCP可能不存在了】No Agents, Just Python-use!》提到了“AI章鱼关了起来,并对它的触手安装了巨大的枷锁”很大部分就是这个环境交互的问题,这个其实也包括Manus这种云端的模式,所以我在祝福Manus被Meta收购成功上岸的同时,是不看好这种模式的,因为这种模式最终模型厂商都会内化

“6. Nano banana / LLM GUI”

当然这个点入选一点也不意外,Google的Gemini3和香蕉模型的成功,到现在估计仍然还是“奥特曼”的噩梦,即使是“边角料”应用的NotebookLM因为香蕉模型的加持,直接改写了那些PPT agent进程历史,在我个人看来NotebookLM的信息图及ppt生成,真正做到了可实际应用的阶段,在我的心里是可以Cursor时刻相媲美,当然还有很多细节值得优化,可惜看起来Google对NotebookLM的重视程度在我看来远远不够 …

有点跑偏了,在本文这个背景下其实应该关注的是LLM GUI,因为在AI Agent的领域里Agent 2.0还有一个拼图就是LLM GUI,对操作系统、APP等的GUI的理解,实际上到现在Python-use的范式,对于GUI的控制是非常有限的,主要依赖API服务的能力,在上文提到的phone use的尝试就是这样,当然在后续有对应的模型出现,比如智谱AutoGLM-Phone-9B等模型,会通过API Calling实现MOE方式完全是可以兼容的,只是这个依赖模型厂商提供的模型能力。

小结

2025年最后一天,在2025年Python-use范式的诞生,有幸看到了很多的理念与大佬的理解认识趋同的地方,当然不管是什么样的范式和技术路线,最终的效果可能都是一样的!最后我也想表达一下对于Python-use范式的核心关键在于:Code就是标准协议、与环境交互接口。有着天然的完整性和扩展性。

最后提一下Manus被收购的这个事情,其实我在很多次都提到Manus与Cursor是AI Agent领域创业非常值得学习研究的对象,因为他们打破了“大厂”的魔咒,Manus的成功上岸,取决于他们的运作及产品本身,在当时那个时间节点Manus的产品有它的亮点和优势,然后可能是结合他们在Web3领域的项目运营经验,能一举突破,都是值得研究的。而且有个既定的事实:实际上到目前为止很多人可能都不知道Cursor是什么,Manus又是什么?知道的可能也有很多人并没有用过Manus …

至于Meta收购Manus妄想继续WhatsApp类似的收购案例的复刻,我估计不太可能,现在其实这种云端的Agent更多的依赖模型,而Meta目前看上去在基础大模型上已经掉队很久了,当然Meta不差钱,后面还能不能力挽狂澜,还得看基础大模型,单凭个Manus很难!!! 当然这种其实可能都是小波浪,因为在现在LLM模式下还没有看到一个符合现在LLM模式的商业基础模式,现在还在技术变革的阶段,就像豆包手机那样,可能就是一个小插曲!

祝大家在2026年66大顺~~


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:黑哥虾撩 heige《2026 AI Agent 的核心:Context Engineering,让环境可计算化》

ITDR丨2025产品年报 网络安全文章

ITDR丨2025产品年报

文章总结: 本文档为网星安全2025年ITDR产品年报,主要介绍了其ITDR身份威胁检测与响应平台。报告回顾了年度产品发展,重点阐述了在身份威胁检测与响应领域的
评论:0   参与:  0