Overview
GUMem(General User Memory)是面向 Agent 的用户记忆引擎。它接收对话消息和行为记录,抽取出后续任务可复用的 Memory,并在新的 Agent 回合中召回相关上下文。

Memory 的四层模型
GUMem 的公开模型按召回时的抽象层级理解:

| 层级 | 作用 | 示例 |
|---|---|---|
Topic | 高层主题,用于找到相关记忆区域。 | team scheduling |
Summary | 可长期召回的压缩记忆,由一组 Facts 支撑。 | 用户偏好欧洲团队排期默认使用 Berlin。 |
Facts | 从 Message 中抽取出的可追踪事实、偏好、计划或约束。 | 用户说过 Europe 对应 Berlin,Americas 对应 Toronto。 |
Message | 原始对话消息或行为输入。 | 用户原始消息、搜索、筛选、收藏或工具调用结果。 |
写入时通常从 Message 开始,逐步形成 Facts、Summary 和 Topic。召回时通常从 Topic 找到相关区域,再取回 Summary,必要时补充支撑它的 Facts。
核心能力
| 能力 | 说明 |
|---|---|
| 会话 Message 写入 | 把用户、assistant 或 system 消息写入指定 Session,并进入后续 Memory 处理链路。 |
| 行为 Message 写入 | 记录搜索、筛选、点击、收藏、工具调用和业务事件,补全用户没有直接说出的意图。 |
| Facts 与 Summary 生成 | 从原始输入中提取可追踪事实,再压缩成更适合长期召回的 Summary。 |
| Topic 分层召回 | 在新的 Agent 回合中先定位相关 Topic,再召回 Summary 和必要 Facts。 |
| 治理与可解释性 | 保留来源、处理阶段、状态和 webhook 扩展点,方便审计、过滤和业务规则注入。 |
最小接入链路
- 创建
Session,并把它绑定到你的业务用户标识。 - 在对话或行为发生后写入 Message。
- 在下一轮 Agent 响应前调用 Query Memory。
- 把返回的
formatted_context或结构化 Memory 放入模型上下文。 - 回复生成后,把新的用户消息和 assistant 回复写回 GUMem。
这条链路的顺序很重要:先召回,再生成,再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory,而不是把当前回复误当作历史事实。
文档入口
- Quick Start:用 Node SDK 完成第一次接入。
- GUMem 如何工作:理解 Message、Facts、Summary 和 Topic 的关系。
- 多模态内容:了解文本、图片和 video 内容如何进入 GUMem。
- 新增记忆:写入新的 Message。
- 查询记忆:了解如何召回 Topic、Summary、Facts 和近期 Message。
- User Case:查看 GUMem 在典型 Agent 回合中的使用方式。