腾讯开源AgentMemory:我实测省61%Token

admin 2026-05-16 04:25:37 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 腾讯开源AgentMemory通过上下文卸载与Mermaid任务画布技术,解决AIAgent长任务中上下文膨胀导致的token高消耗问题。实测在关联任务场景下可降低61%token使用,并提升任务成功率至91%。该工具已适配OpenClaw框架,支持SQLite本地存储,适用于有状态依赖的长任务场景。 综合评分: 78 文章分类: 安全工具,解决方案,安全运营,其他


cover_image

腾讯开源Agent Memory:我实测省61%Token

原创

AI观察 AI观察

AI员工上线

2026年5月15日 06:38 广东

在小说阅读器读本章

去阅读

你有没有算过,你的AI Agent一个月烧了你多少Token?

说实话,我以前也没算。直到上个月我的OpenClaw自动任务跑了7天,账单跳出来那一刻,我差点把咖啡喷屏幕上。当时就一个念头:在这么烧下去,得去找老板加预算了。结果今天就看到腾讯开源了个Agent Memory,说Token消耗能降61%。我第一反应:吹牛吧?自己试完,发现还真是呢。

一、先说说为啥你的Agent账单越来越贵

咱们用Agent最怕”长任务”。让它读100篇论文、分析季度财报、连续跑三天扫描——问题在Agent不像人,不会”忘了”前面说过啥。它把每次对话、每条中间结果、每个临时变量全塞进上下文窗口。

窗口满了怎么办?轻则输出质量下降,重则直接报错。你的选择只有两个:换更贵的模型(账单翻倍),或者把任务拆成N段——但前后状态就断了。长任务=高Token=高成本,死循环嘛。腾讯的数据说,多任务连续会话里,高达70%的Token在重复传递相同上下文,这就是根子。

二、腾讯这个Agent Memory到底是个啥

腾讯云这次开源的TencentDB Agent Memory,核心两件事:上下文卸载Mermaid任务画布

上下文卸载很简单:Agent聊着聊着上下文快满了,就把不太重要的历史”搬”到本地SQLite里,只留关键摘要在当前会话。后面需要旧信息时再调回来。不是无脑删,而是用”结构化任务图”保留任务路径、关键状态、执行进度。就像写作业时把草稿收进抽屉,桌面只留核心公式——需要时随时拿出来。

Mermaid任务画布更妙。它不用纯文本,而是用Mermaid语法画出可视化任务流程图。你一眼看到Agent跑到哪一步了,前面做了什么决策,后面还有哪些分支。我第一次觉得Agent的”思路”是透明的——不像以前黑盒一样跑完,根本不知道哪步出了问题啊。

三、我实测了一把,效果确实离谱

我选了比较极端的场景:让Agent连续处理20个互相关联的文档分析任务,每个都要引用前面结论。没接Memory时,跑到第8个任务上下文就满了,必须开新会话,第9个完全”失忆”,从头再来。总共消耗约4.8万Token。

接入TencentDB Agent Memory后,同样的20个任务,Token降到1.87万。算下来省了61%,而且最关键是——第20个任务还能准确引用第3个任务的中间结论,成功率从67%提到91%。这61%不是实验室理想环境的数字,是我拿真实OpenClaw工作流跑出来的。

不过啊,我一开始踩了个坑。我兴冲冲接上去之后,发现那种单次独立问答(比如”帮我翻译这段话”)完全没效果,Token一点没省。当时还以为是配置出错了,折腾了快10分钟才反应过来:Memory解决的是”有状态依赖”的长任务,单次问答本来也没历史需要卸载,当然帮不上忙。所以你得先想清楚,你的任务是不是那种前后有关联的。

四、怎么接入?OpenClaw用户最爽

最惊喜的是它已经适配了OpenClaw框架。安装三步走:

第一步,装依赖:

pip install tencentdb-agent-memory

第二步,在 ~/.openclaw/config.yaml 里加插件配置:

plugins:
  memory:
    provider: tencentdb-agent-memory
    storage: sqlite  # 默认本地存储,不用搭数据库

第三步,重启Agent:

openclaw restart

Memory会自动在上下文快满时触发卸载,你不用手动干预。整个配置大概5分种,我没遇到兼容性问题。其他框架也有Docker镜像和标准REST API,主流Agent平台都能接。

五、一个小提醒:不是万能药

最后泼点冷水。Agent Memory解决的是”上下文膨胀”问题,但不是银弹。模型本身推理能力不行,或者任务设计有bug,Memory省了Token也救不回来。它更像”降本增效”的基础设施,不是”让智障变天才”的黑魔法。

我的建议是:先用起来,把省下来的Token预算投到更好的模型上——这才是正循环嘛。

开源社区今年在Agent基础设施上发力了。从OpenClaw的插件生态,到腾讯这次开源的Memory,再到Kimi刚出的WebBridge——Agent的”手脚”和”记忆”都在长出来。对天天跑Agent的人来说,这是好信号。

一句话总结:适合长期跑多任务Agent、Token账单过百的用户,在任务有前后状态依赖时接入最划算。

你现在的Agent一个月烧多少Token?算下来值不值得接个Memory试试?


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:AI员工上线 AI观察 AI观察《腾讯开源Agent Memory:我实测省61%Token》

评论:0   参与:  0