99%降幅!Cloudflare发布CodeMode,再也不用为MCP上下文不够发愁

admin 2026-03-03 07:47:32 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: Cloudflare发布CodeMode技术,利用search与execute双工具,仅用1000token覆盖2500个API,降幅达99.9%。该方案解决传统MCP上下文占用痛点,结合沙箱与OAuth保障安全,无需Agent端改造,实现高效渐进式发现,为AIAgent规模化落地扫清障碍,重构了工具调用逻辑。 综合评分: 93 文章分类: AI安全,安全工具,解决方案


cover_image

99% 降幅!Cloudflare发布Code Mode,再也不用为MCP上下文不够发愁

原创

玄月调查小组 玄月调查小组

玄月调查小组

2026年2月22日 09:45 上海

Cloudflare发布了基于Code Mode技术的全新全量Cloudflare API MCP 服务器,同时开源 Code Mode SDK。该方案通过仅2个核心工具、约1000个token的固定上下文占用,实现了对Cloudflare平台超2500个API端点的完整覆盖,相较传统MCP实现方案,token占用降低幅度达到99.9%,解决了AI Agent工具调用中,“工具能力扩容与上下文窗口占用” 的矛盾,为 AI Agent 的规模化工具调用能力落地扫清了障碍。

MCP生态背后,工具能力与上下文窗口的零和博弈

MCP已经成为AI Agent调用外部工具的事实标准,是Agent从“对话交互”走向“任务执行”的核心基础设施,让Agent能够无缝对接各类外部系统、API与服务,完成从代码开发、运维自动化到业务流程处理的复杂任务。

但随着MCP生态的快速发展,其底层设计的核心矛盾也愈发突出:Agent想要完成更复杂的任务,就需要接入更多的工具与更完整的API能力;但传统MCP采用“一个API端点对应一个工具”的设计,每新增一个工具,就需要将对应的功能描述、参数规范、响应结构全部填入大模型的上下文窗口。工具数量越多,上下文占用就越大,留给用户核心任务的推理空间就越少,不仅会稀释大模型的能力,还会导致响应延迟升高、调用成本激增。

对于Cloudflare这类拥有超大规模API体系的平台,矛盾尤为突出。其全量API包含超2500个端点,覆盖DNS、零信任、WAF、DDoS防护等全产品线。如果按照传统MCP的实现方式,为每个 API 端点单独定义工具,仅全量API的工具定义就需要消耗117万token,这一数字已经超过了当前市面上绝大多数大模型的完整上下文窗口,直接导致传统MCP方案无法落地。

即便是拆分后的单产品 MCP 服务器,也面临着 API 迭代快、人工维护成本高、工具集持续膨胀的问题,无法跟上产品更新的节奏。

Code Mode技术破局,双工具实现全API能力的千级token封装

面对这一行业痛点,Cloudflare推出的Code Mode技术,给出了一套完全不同于传统 MCP 的实现思路。不同于传统MCP逐个拆解API为独立工具的思路,基于服务器Code Mode的全新MCP服务器,仅向大模型暴露了search()execute()两个核心工具,就实现了全量Cloudflare API的能力覆盖,且上下文占用稳定维持在约1000个token,不会随API规模的扩大而增长。两个核心工具形成了完整的能力闭环,从API发现到执行全流程实现了极致的上下文效率:

  • search()工具:为Agent提供了对Cloudflare全量OpenAPI规范的代码化搜索能力。Agent无需将完整的API规范加载进上下文窗口,只需编写简单的JavaScript代码,即可按照产品、路径、标签等维度,从超2500个API端点中筛选出自身需要的接口,还可深入查询特定接口的参数规范、响应结构等细节信息。全程只有代码和搜索结果进入上下文,全量API规范始终不会占用窗口资源。
  • execute()工具:为Agent提供了代码化的API执行能力。Agent可直接编写JavaScript代码,完成API请求发起、分页处理、响应校验、多接口链式调用等复杂操作,在单次工具调用中完成多步执行动作。

服务端 Code Mode 落地:安全沙箱 + 渐进式发现的优势

此次 Cloudflare 发布的 MCP 服务器,将 Code Mode 的执行逻辑完全放在服务端实现,同时解决了代码执行的安全性问题与 API 能力的渐进式发现问题,让方案具备了生产级落地的能力。

在能力发现层面,Code Mode 实现了真正的渐进式 API 能力发现。传统 MCP 服务器需要提前把所有工具定义加载到上下文,而 Code Mode 模式下,AI Agent 可以通过search()工具,根据用户的任务需求,按需检索对应的 API 能力,从 2500 + 个端点中筛选出所需的接口,完整的 API 规范始终不会进入上下文窗口。Cloudflare 官方给出的示例显示,即便是 “为源站配置 DDoS 防护与 WAF 规则” 这样的复杂任务,AI Agent 仅需 4 次工具调用,就能完成从 API 检索、规范查询、规则校验到配置下发的全流程操作。

在安全上,遵循最新的MCP规范,兼容OAuth 2.1协议,通过Cloudflare Workers OAuth Provider实现了精细化的权限下放。用户在连接Agent时,可自主选择授予的权限范围,Agent仅能获得用户明确批准的操作能力,避免了过度授权带来的安全风险。同时,沙箱化的代码执行环境Cloudflare Dynamic Worker,默认关闭文件系统访问、环境变量读取、外部网络请求。也杜绝了提示词注入、敏感信息泄露等问题,为企业级场景的使用提供了安全保障。

服务端Code Mode的优势

针对MCP工具的上下文占用优化,行业内已经出现了多种技术方案,而Cloudflare此次推出的服务端Code Mode,整合了各类方案的优势,同时规避了其核心短板。

| 方案 | 原理 | 优势 | 局限 | | — | — | — | — | | 客户端Code Mode | 模型基于带类型的SDK编写代码,在客户端沙箱中执行 | 代码表达性强,上下文占用低 | 需要Agent端内置安全沙箱,适配成本高 | | CLI命令行模式 | 将MCP服务转换为CLI,让Agent通过命令行探索与调用能力 | 渐进式能力发现,无需预加载全量工具 | 需要Agent端提供Shell环境,攻击面大,安全性弱 | | 动态工具搜索 | 基于任务匹配相关工具,仅向模型推送少量相关工具定义 | 无需修改Agent架构,兼容性好 | 依赖搜索效果,匹配精度不稳定,仍有固定token消耗 | | Cloudflare服务端Code Mode | 服务端封装双工具,模型通过代码完成搜索与执行,沙箱内运行 | 固定千级token占用,不随API规模增长;无需Agent端改造,兼容性强;内置渐进式发现;沙箱隔离安全性高 | 需服务端适配Code Mode架构 |

整体来看,服务端Code Mode在token成本、兼容性、安全性、可扩展性上实现了更好的平衡,成为当前 MCP 生态中兼顾性能、安全、通用性的最优解决方案。

点评

Code Mode 的落地,本质上是对 AI Agent 工具调用逻辑的一次底层重构。过去行业始终在 “如何让大模型看懂更多工具” 的方向上内卷,却忽略了一个最核心的问题:大模型最擅长的不是记忆和匹配海量的工具定义,而是逻辑推理和代码生成。

Code Mode 正是抓住了这一点,用 “代码生成” 替代 “工具定义”,用 “服务端执行” 替代 “多轮调用”,既释放了大模型的能力优势,又从根源上解决了上下文窗口的瓶颈问题。

结合近期Cloudflare接连发布的Markdown for Agents、Moltworker等功能/产品,不难看出Cloudflare正在围绕AI生态,构建一套从内容、工具调用到安全管控的完整能力矩阵,基于本身在网络与安全的积累,向AI Infra迈进。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

参考资料:Code Mode: give agents an entire API in 1,000 tokens https://blog.cloudflare.com/code-mode-mcp/ https://github.com/cloudflare/agents/tree/main/packages/codemode


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:玄月调查小组 玄月调查小组 玄月调查小组《99% 降幅!Cloudflare发布Code Mode,再也不用为MCP上下文不够发愁》

评论:0   参与:  0