5月14日,据腾讯云公众号消息,腾讯正式面向全球开源 TencentDB Agent Memory ,针对Agent 长任务场景提供长期和短期记忆压缩能力,支持 OpenClaw、Hermes 等主流 Agent 框架一键部署。在多任务连续 Session 实验中,该方案最高可降低 61% Token 消耗,并将任务成功率最高提升 51%。
当前,Agent 在代码开发、网页搜索、研究分析等场景中的任务链路持续变长,工具调用产生的大量网页内容、代码日志和中间结果,会快速占满上下文窗口导致Token 成本持续上升。
业内当前常见的解决方式,通常是扩大上下文窗口,或对历史内容进行压缩摘要,但在长任务场景下,仍然容易出现上下文膨胀、任务状态混乱等问题。
腾讯云数据库团队开源的TencentDB Agent Memory ,提出了一套新的记忆压缩方案:将完整信息卸载到外部存储,同时保留任务执行过程中的关键状态与结构关系。
其中一项核心能力是“Mermaid 任务画布”。系统会将 Agent 的任务过程组织成结构化任务图,保留任务状态、步骤摘要和执行关系。即使上下文中只保留一张轻量级任务画布,Agent 依然能够快速判断当前任务进度,以及不同步骤之间的依赖关系。
另一项核心能力是“上下文卸载(Context Offloading)”。工具调用完成后,网页内容、日志和中间结果等原始信息不会继续长期占用上下文窗口,而是转移到外部文件系统保存;上下文中仅保留摘要和索引信息,需要时再按需恢复。
根据腾讯云披露的测试数据显示,启用该记忆方案后,Agent 在网页搜索场景中 Token 消耗最高降低 61%、成功率相对提升 52%;代码修复场景中 Token 消耗最高降低 33%、完成率相对提升 10%;复杂长文档场景中 Token 消耗最高降低 31%、准确率相对提升8%。
此外,该项目还包含长期个性化记忆模块,可在Agent跨对话中自动提取用户偏好与历史背景。在 PersonaMem 评测中,该模块将 Agent 对用户画像的理解准确率从 48% 提升至 76%,此前已免费开放服务。
目前,Agent Memory 已在 GitHub 正式开源,支持 OpenClaw、Hermes 等主流 Agent 框架。开发者只需一行命令即可安装使用,无需额外配置数据库或外部服务。Agent 的任务记录、记忆内容等信息,也都会以普通文件形式保存,方便直接查看和调试。
今年以来,腾讯正持续加速 Agent 技术生态布局。上个月,腾讯云开源了 Agent 执行底座 Cube,两周 GitHub Star 数超过 5000。
SeetaFace6采用了商用版最新的推理引擎TenniS,ResNet50的推理速度,从SeetaFace2在I7的8FPS提升到了20FPS
要知道,这家一度星光四溢、获得腾讯、IDG押注的无人车公司,曾率先创下美国无人车创业公司最高估值——上一轮以32亿美元完成5亿美元融资。
量子位 QbitAI