文章总结: 腾讯开源AgentMemory通过上下文卸载与Mermaid任务画布技术,解决AIAgent长任务中上下文膨胀导致的token高消耗问题。实测在关联任务场景下可降低61%token使用,并提升任务成功率至91%。该工具已适配OpenClaw框架,支持SQLite本地存储,适用于有状态依赖的长任务场景。 综合评分: 78 文章分类: 安全工具,解决方案,安全运营,其他
腾讯开源Agent Memory:我实测省61%Token
原创
AI观察 AI观察
AI员工上线
2026年5月15日 06:38 广东
在小说阅读器读本章
去阅读
你有没有算过,你的AI Agent一个月烧了你多少Token?
说实话,我以前也没算。直到上个月我的OpenClaw自动任务跑了7天,账单跳出来那一刻,我差点把咖啡喷屏幕上。当时就一个念头:在这么烧下去,得去找老板加预算了。结果今天就看到腾讯开源了个Agent Memory,说Token消耗能降61%。我第一反应:吹牛吧?自己试完,发现还真是呢。
一、先说说为啥你的Agent账单越来越贵
咱们用Agent最怕”长任务”。让它读100篇论文、分析季度财报、连续跑三天扫描——问题在Agent不像人,不会”忘了”前面说过啥。它把每次对话、每条中间结果、每个临时变量全塞进上下文窗口。
窗口满了怎么办?轻则输出质量下降,重则直接报错。你的选择只有两个:换更贵的模型(账单翻倍),或者把任务拆成N段——但前后状态就断了。长任务=高Token=高成本,死循环嘛。腾讯的数据说,多任务连续会话里,高达70%的Token在重复传递相同上下文,这就是根子。
二、腾讯这个Agent Memory到底是个啥
腾讯云这次开源的TencentDB Agent Memory,核心两件事:上下文卸载和Mermaid任务画布。
上下文卸载很简单:Agent聊着聊着上下文快满了,就把不太重要的历史”搬”到本地SQLite里,只留关键摘要在当前会话。后面需要旧信息时再调回来。不是无脑删,而是用”结构化任务图”保留任务路径、关键状态、执行进度。就像写作业时把草稿收进抽屉,桌面只留核心公式——需要时随时拿出来。
Mermaid任务画布更妙。它不用纯文本,而是用Mermaid语法画出可视化任务流程图。你一眼看到Agent跑到哪一步了,前面做了什么决策,后面还有哪些分支。我第一次觉得Agent的”思路”是透明的——不像以前黑盒一样跑完,根本不知道哪步出了问题啊。
三、我实测了一把,效果确实离谱
我选了比较极端的场景:让Agent连续处理20个互相关联的文档分析任务,每个都要引用前面结论。没接Memory时,跑到第8个任务上下文就满了,必须开新会话,第9个完全”失忆”,从头再来。总共消耗约4.8万Token。
接入TencentDB Agent Memory后,同样的20个任务,Token降到1.87万。算下来省了61%,而且最关键是——第20个任务还能准确引用第3个任务的中间结论,成功率从67%提到91%。这61%不是实验室理想环境的数字,是我拿真实OpenClaw工作流跑出来的。
不过啊,我一开始踩了个坑。我兴冲冲接上去之后,发现那种单次独立问答(比如”帮我翻译这段话”)完全没效果,Token一点没省。当时还以为是配置出错了,折腾了快10分钟才反应过来:Memory解决的是”有状态依赖”的长任务,单次问答本来也没历史需要卸载,当然帮不上忙。所以你得先想清楚,你的任务是不是那种前后有关联的。
四、怎么接入?OpenClaw用户最爽
最惊喜的是它已经适配了OpenClaw框架。安装三步走:
第一步,装依赖:
pip install tencentdb-agent-memory
第二步,在 ~/.openclaw/config.yaml 里加插件配置:
plugins:
memory:
provider: tencentdb-agent-memory
storage: sqlite # 默认本地存储,不用搭数据库
第三步,重启Agent:
openclaw restart
Memory会自动在上下文快满时触发卸载,你不用手动干预。整个配置大概5分种,我没遇到兼容性问题。其他框架也有Docker镜像和标准REST API,主流Agent平台都能接。
五、一个小提醒:不是万能药
最后泼点冷水。Agent Memory解决的是”上下文膨胀”问题,但不是银弹。模型本身推理能力不行,或者任务设计有bug,Memory省了Token也救不回来。它更像”降本增效”的基础设施,不是”让智障变天才”的黑魔法。
我的建议是:先用起来,把省下来的Token预算投到更好的模型上——这才是正循环嘛。
开源社区今年在Agent基础设施上发力了。从OpenClaw的插件生态,到腾讯这次开源的Memory,再到Kimi刚出的WebBridge——Agent的”手脚”和”记忆”都在长出来。对天天跑Agent的人来说,这是好信号。
一句话总结:适合长期跑多任务Agent、Token账单过百的用户,在任务有前后状态依赖时接入最划算。
你现在的Agent一个月烧多少Token?算下来值不值得接个Memory试试?
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:AI员工上线 AI观察 AI观察《腾讯开源Agent Memory:我实测省61%Token》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论