2026-05-16 04:25:37 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 腾讯开源AgentMemory通过上下文卸载与Mermaid任务画布技术，解决AIAgent长任务中上下文膨胀导致的token高消耗问题。实测在关联任务场景下可降低61%token使用，并提升任务成功率至91%。该工具已适配OpenClaw框架，支持SQLite本地存储，适用于有状态依赖的长任务场景。 综合评分： 78 文章分类： 安全工具,解决方案,安全运营,其他

cover_image

腾讯开源Agent Memory：我实测省61%Token

原创

AI观察 AI观察

AI员工上线

2026年5月15日 06:38 广东

在小说阅读器读本章

去阅读

你有没有算过，你的AI Agent一个月烧了你多少Token？

说实话，我以前也没算。直到上个月我的OpenClaw自动任务跑了7天，账单跳出来那一刻，我差点把咖啡喷屏幕上。当时就一个念头：在这么烧下去，得去找老板加预算了。结果今天就看到腾讯开源了个Agent Memory，说Token消耗能降61%。我第一反应：吹牛吧？自己试完，发现还真是呢。

一、先说说为啥你的Agent账单越来越贵

咱们用Agent最怕”长任务”。让它读100篇论文、分析季度财报、连续跑三天扫描——问题在Agent不像人，不会”忘了”前面说过啥。它把每次对话、每条中间结果、每个临时变量全塞进上下文窗口。

窗口满了怎么办？轻则输出质量下降，重则直接报错。你的选择只有两个：换更贵的模型（账单翻倍），或者把任务拆成N段——但前后状态就断了。长任务=高Token=高成本，死循环嘛。腾讯的数据说，多任务连续会话里，高达70%的Token在重复传递相同上下文，这就是根子。

二、腾讯这个Agent Memory到底是个啥

腾讯云这次开源的TencentDB Agent Memory，核心两件事：上下文卸载和Mermaid任务画布。

上下文卸载很简单：Agent聊着聊着上下文快满了，就把不太重要的历史”搬”到本地SQLite里，只留关键摘要在当前会话。后面需要旧信息时再调回来。不是无脑删，而是用”结构化任务图”保留任务路径、关键状态、执行进度。就像写作业时把草稿收进抽屉，桌面只留核心公式——需要时随时拿出来。

Mermaid任务画布更妙。它不用纯文本，而是用Mermaid语法画出可视化任务流程图。你一眼看到Agent跑到哪一步了，前面做了什么决策，后面还有哪些分支。我第一次觉得Agent的”思路”是透明的——不像以前黑盒一样跑完，根本不知道哪步出了问题啊。

三、我实测了一把，效果确实离谱

我选了比较极端的场景：让Agent连续处理20个互相关联的文档分析任务，每个都要引用前面结论。没接Memory时，跑到第8个任务上下文就满了，必须开新会话，第9个完全”失忆”，从头再来。总共消耗约4.8万Token。

接入TencentDB Agent Memory后，同样的20个任务，Token降到1.87万。算下来省了61%，而且最关键是——第20个任务还能准确引用第3个任务的中间结论，成功率从67%提到91%。这61%不是实验室理想环境的数字，是我拿真实OpenClaw工作流跑出来的。

不过啊，我一开始踩了个坑。我兴冲冲接上去之后，发现那种单次独立问答（比如”帮我翻译这段话”）完全没效果，Token一点没省。当时还以为是配置出错了，折腾了快10分钟才反应过来：Memory解决的是”有状态依赖”的长任务，单次问答本来也没历史需要卸载，当然帮不上忙。所以你得先想清楚，你的任务是不是那种前后有关联的。

四、怎么接入？OpenClaw用户最爽

最惊喜的是它已经适配了OpenClaw框架。安装三步走：

第一步，装依赖：

pip&nbsp;install&nbsp;tencentdb-agent-memory

第二步，在 ~/.openclaw/config.yaml 里加插件配置：

plugins:
&nbsp;&nbsp;memory:
&nbsp;&nbsp;&nbsp;&nbsp;provider:&nbsp;tencentdb-agent-memory
&nbsp;&nbsp;&nbsp;&nbsp;storage:&nbsp;sqlite&nbsp;&nbsp;#&nbsp;默认本地存储，不用搭数据库

第三步，重启Agent：

openclaw&nbsp;restart

Memory会自动在上下文快满时触发卸载，你不用手动干预。整个配置大概5分种，我没遇到兼容性问题。其他框架也有Docker镜像和标准REST API，主流Agent平台都能接。

五、一个小提醒：不是万能药

最后泼点冷水。Agent Memory解决的是”上下文膨胀”问题，但不是银弹。模型本身推理能力不行，或者任务设计有bug，Memory省了Token也救不回来。它更像”降本增效”的基础设施，不是”让智障变天才”的黑魔法。

我的建议是：先用起来，把省下来的Token预算投到更好的模型上——这才是正循环嘛。

开源社区今年在Agent基础设施上发力了。从OpenClaw的插件生态，到腾讯这次开源的Memory，再到Kimi刚出的WebBridge——Agent的”手脚”和”记忆”都在长出来。对天天跑Agent的人来说，这是好信号。

一句话总结：适合长期跑多任务Agent、Token账单过百的用户，在任务有前后状态依赖时接入最划算。

你现在的Agent一个月烧多少Token？算下来值不值得接个Memory试试？

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：AI员工上线 AI观察 AI观察《腾讯开源Agent Memory：我实测省61%Token》