腾讯开源 Agent 记忆技术方案，Token 消耗最高降低 61%

5月14日，据腾讯云公众号消息，腾讯正式面向全球开源 TencentDB Agent Memory ，针对Agent 长任务场景提供长期和短期记忆压缩能力，支持 OpenClaw、Hermes 等主流 Agent 框架一键部署。在多任务连续 Session 实验中，该方案最高可降低 61% Token 消耗，并将任务成功率最高提升 51%。

当前，Agent 在代码开发、网页搜索、研究分析等场景中的任务链路持续变长，工具调用产生的大量网页内容、代码日志和中间结果，会快速占满上下文窗口导致Token 成本持续上升。

业内当前常见的解决方式，通常是扩大上下文窗口，或对历史内容进行压缩摘要，但在长任务场景下，仍然容易出现上下文膨胀、任务状态混乱等问题。

腾讯云数据库团队开源的TencentDB Agent Memory ，提出了一套新的记忆压缩方案：将完整信息卸载到外部存储，同时保留任务执行过程中的关键状态与结构关系。

其中一项核心能力是“Mermaid 任务画布”。系统会将 Agent 的任务过程组织成结构化任务图，保留任务状态、步骤摘要和执行关系。即使上下文中只保留一张轻量级任务画布，Agent 依然能够快速判断当前任务进度，以及不同步骤之间的依赖关系。

另一项核心能力是“上下文卸载（Context Offloading）”。工具调用完成后，网页内容、日志和中间结果等原始信息不会继续长期占用上下文窗口，而是转移到外部文件系统保存；上下文中仅保留摘要和索引信息，需要时再按需恢复。

根据腾讯云披露的测试数据显示，启用该记忆方案后，Agent 在网页搜索场景中 Token 消耗最高降低 61%、成功率相对提升 52%；代码修复场景中 Token 消耗最高降低 33%、完成率相对提升 10%；复杂长文档场景中 Token 消耗最高降低 31%、准确率相对提升8%。

此外，该项目还包含长期个性化记忆模块，可在Agent跨对话中自动提取用户偏好与历史背景。在 PersonaMem 评测中，该模块将 Agent 对用户画像的理解准确率从 48% 提升至 76%，此前已免费开放服务。

目前，Agent Memory 已在 GitHub 正式开源，支持 OpenClaw、Hermes 等主流 Agent 框架。开发者只需一行命令即可安装使用，无需额外配置数据库或外部服务。Agent 的任务记录、记忆内容等信息，也都会以普通文件形式保存，方便直接查看和调试。

今年以来，腾讯正持续加速 Agent 技术生态布局。上个月，腾讯云开源了 Agent 执行底座 Cube，两周 GitHub Star 数超过 5000。

SeetaFace6采用了商用版最新的推理引擎TenniS，ResNet50的推理速度，从SeetaFace2在I7的8FPS提升到了20FPS

要知道，这家一度星光四溢、获得腾讯、IDG押注的无人车公司，曾率先创下美国无人车创业公司最高估值——上一轮以32亿美元完成5亿美元融资。

量子位 QbitAI