2026-03-03 07:47:32 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： Cloudflare发布CodeMode技术，利用search与execute双工具，仅用1000token覆盖2500个API，降幅达99.9%。该方案解决传统MCP上下文占用痛点，结合沙箱与OAuth保障安全，无需Agent端改造，实现高效渐进式发现，为AIAgent规模化落地扫清障碍，重构了工具调用逻辑。 综合评分： 93 文章分类： AI安全,安全工具,解决方案

cover_image

99% 降幅！Cloudflare发布Code Mode，再也不用为MCP上下文不够发愁

原创

玄月调查小组玄月调查小组

玄月调查小组

2026年2月22日 09:45 上海

Cloudflare发布了基于Code Mode技术的全新全量Cloudflare API MCP 服务器，同时开源 Code Mode SDK。该方案通过仅2个核心工具、约1000个token的固定上下文占用，实现了对Cloudflare平台超2500个API端点的完整覆盖，相较传统MCP实现方案，token占用降低幅度达到99.9%，解决了AI Agent工具调用中，“工具能力扩容与上下文窗口占用” 的矛盾，为 AI Agent 的规模化工具调用能力落地扫清了障碍。

MCP生态背后，工具能力与上下文窗口的零和博弈

MCP已经成为AI Agent调用外部工具的事实标准，是Agent从“对话交互”走向“任务执行”的核心基础设施，让Agent能够无缝对接各类外部系统、API与服务，完成从代码开发、运维自动化到业务流程处理的复杂任务。

但随着MCP生态的快速发展，其底层设计的核心矛盾也愈发突出：Agent想要完成更复杂的任务，就需要接入更多的工具与更完整的API能力；但传统MCP采用“一个API端点对应一个工具”的设计，每新增一个工具，就需要将对应的功能描述、参数规范、响应结构全部填入大模型的上下文窗口。工具数量越多，上下文占用就越大，留给用户核心任务的推理空间就越少，不仅会稀释大模型的能力，还会导致响应延迟升高、调用成本激增。

对于Cloudflare这类拥有超大规模API体系的平台，矛盾尤为突出。其全量API包含超2500个端点，覆盖DNS、零信任、WAF、DDoS防护等全产品线。如果按照传统MCP的实现方式，为每个 API 端点单独定义工具，仅全量API的工具定义就需要消耗117万token，这一数字已经超过了当前市面上绝大多数大模型的完整上下文窗口，直接导致传统MCP方案无法落地。

即便是拆分后的单产品 MCP 服务器，也面临着 API 迭代快、人工维护成本高、工具集持续膨胀的问题，无法跟上产品更新的节奏。

Code Mode技术破局，双工具实现全API能力的千级token封装

面对这一行业痛点，Cloudflare推出的Code Mode技术，给出了一套完全不同于传统 MCP 的实现思路。不同于传统MCP逐个拆解API为独立工具的思路，基于服务器Code Mode的全新MCP服务器，仅向大模型暴露了search()和execute()两个核心工具，就实现了全量Cloudflare API的能力覆盖，且上下文占用稳定维持在约1000个token，不会随API规模的扩大而增长。两个核心工具形成了完整的能力闭环，从API发现到执行全流程实现了极致的上下文效率：

search()工具：为Agent提供了对Cloudflare全量OpenAPI规范的代码化搜索能力。Agent无需将完整的API规范加载进上下文窗口，只需编写简单的JavaScript代码，即可按照产品、路径、标签等维度，从超2500个API端点中筛选出自身需要的接口，还可深入查询特定接口的参数规范、响应结构等细节信息。全程只有代码和搜索结果进入上下文，全量API规范始终不会占用窗口资源。
execute()工具：为Agent提供了代码化的API执行能力。Agent可直接编写JavaScript代码，完成API请求发起、分页处理、响应校验、多接口链式调用等复杂操作，在单次工具调用中完成多步执行动作。

服务端 Code Mode 落地：安全沙箱 + 渐进式发现的优势

此次 Cloudflare 发布的 MCP 服务器，将 Code Mode 的执行逻辑完全放在服务端实现，同时解决了代码执行的安全性问题与 API 能力的渐进式发现问题，让方案具备了生产级落地的能力。

在能力发现层面，Code Mode 实现了真正的渐进式 API 能力发现。传统 MCP 服务器需要提前把所有工具定义加载到上下文，而 Code Mode 模式下，AI Agent 可以通过search()工具，根据用户的任务需求，按需检索对应的 API 能力，从 2500 + 个端点中筛选出所需的接口，完整的 API 规范始终不会进入上下文窗口。Cloudflare 官方给出的示例显示，即便是 “为源站配置 DDoS 防护与 WAF 规则” 这样的复杂任务，AI Agent 仅需 4 次工具调用，就能完成从 API 检索、规范查询、规则校验到配置下发的全流程操作。

在安全上，遵循最新的MCP规范，兼容OAuth 2.1协议，通过Cloudflare Workers OAuth Provider实现了精细化的权限下放。用户在连接Agent时，可自主选择授予的权限范围，Agent仅能获得用户明确批准的操作能力，避免了过度授权带来的安全风险。同时，沙箱化的代码执行环境Cloudflare Dynamic Worker，默认关闭文件系统访问、环境变量读取、外部网络请求。也杜绝了提示词注入、敏感信息泄露等问题，为企业级场景的使用提供了安全保障。

服务端Code Mode的优势

针对MCP工具的上下文占用优化，行业内已经出现了多种技术方案，而Cloudflare此次推出的服务端Code Mode，整合了各类方案的优势，同时规避了其核心短板。

整体来看，服务端Code Mode在token成本、兼容性、安全性、可扩展性上实现了更好的平衡，成为当前 MCP 生态中兼顾性能、安全、通用性的最优解决方案。

点评

Code Mode 的落地，本质上是对 AI Agent 工具调用逻辑的一次底层重构。过去行业始终在 “如何让大模型看懂更多工具” 的方向上内卷，却忽略了一个最核心的问题：大模型最擅长的不是记忆和匹配海量的工具定义，而是逻辑推理和代码生成。

Code Mode 正是抓住了这一点，用 “代码生成” 替代 “工具定义”，用 “服务端执行” 替代 “多轮调用”，既释放了大模型的能力优势，又从根源上解决了上下文窗口的瓶颈问题。

结合近期Cloudflare接连发布的Markdown for Agents、Moltworker等功能/产品，不难看出Cloudflare正在围绕AI生态，构建一套从内容、工具调用到安全管控的完整能力矩阵，基于本身在网络与安全的积累，向AI Infra迈进。

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章，我们，下次再见。

参考资料:Code Mode: give agents an entire API in 1,000 tokens https://blog.cloudflare.com/code-mode-mcp/ https://github.com/cloudflare/agents/tree/main/packages/codemode

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：玄月调查小组玄月调查小组玄月调查小组《99% 降幅！Cloudflare发布Code Mode，再也不用为MCP上下文不够发愁》