Skip to content
Go to Dashboard

Overview

GUMem(General User Memory)是面向 Agent 的用户记忆引擎。它接收对话消息和行为记录,抽取出后续任务可复用的 Memory,并在新的 Agent 回合中召回相关上下文。

GUMem memory overview

Memory 的四层模型

GUMem 的公开模型按召回时的抽象层级理解:

Memory 的四层模型

层级作用示例
Topic高层主题,用于找到相关记忆区域。team scheduling
Summary可长期召回的压缩记忆,由一组 Facts 支撑。用户偏好欧洲团队排期默认使用 Berlin。
Facts从 Message 中抽取出的可追踪事实、偏好、计划或约束。用户说过 Europe 对应 Berlin,Americas 对应 Toronto。
Message原始对话消息或行为输入。用户原始消息、搜索、筛选、收藏或工具调用结果。

写入时通常从 Message 开始,逐步形成 FactsSummaryTopic。召回时通常从 Topic 找到相关区域,再取回 Summary,必要时补充支撑它的 Facts

核心能力

能力说明
会话 Message 写入把用户、assistant 或 system 消息写入指定 Session,并进入后续 Memory 处理链路。
行为 Message 写入记录搜索、筛选、点击、收藏、工具调用和业务事件,补全用户没有直接说出的意图。
Facts 与 Summary 生成从原始输入中提取可追踪事实,再压缩成更适合长期召回的 Summary。
Topic 分层召回在新的 Agent 回合中先定位相关 Topic,再召回 Summary 和必要 Facts。
治理与可解释性保留来源、处理阶段、状态和 webhook 扩展点,方便审计、过滤和业务规则注入。

最小接入链路

  1. 创建 Session,并把它绑定到你的业务用户标识。
  2. 在对话或行为发生后写入 Message。
  3. 在下一轮 Agent 响应前调用 Query Memory。
  4. 把返回的 formatted_context 或结构化 Memory 放入模型上下文。
  5. 回复生成后,把新的用户消息和 assistant 回复写回 GUMem。

这条链路的顺序很重要:先召回,再生成,再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory,而不是把当前回复误当作历史事实。

文档入口

  • Quick Start:用 Node SDK 完成第一次接入。
  • GUMem 如何工作:理解 Message、Facts、Summary 和 Topic 的关系。
  • 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
  • 新增记忆:写入新的 Message。
  • 查询记忆:了解如何召回 Topic、Summary、Facts 和近期 Message。
  • User Case:查看 GUMem 在典型 Agent 回合中的使用方式。