Overview

GUMem（General User Memory）是面向 Agent 的用户记忆引擎。它接收对话消息和行为记录，抽取出后续任务可复用的 Memory，并在新的 Agent 回合中召回相关上下文。

GUMem memory overview

Memory 的四层模型

GUMem 的公开模型按召回时的抽象层级理解：

Memory 的四层模型

层级	作用	示例
`Topic`	高层主题，用于找到相关记忆区域。	`team scheduling`
`Summary`	可长期召回的压缩记忆，由一组 Facts 支撑。	用户偏好欧洲团队排期默认使用 Berlin。
`Facts`	从 Message 中抽取出的可追踪事实、偏好、计划或约束。	用户说过 Europe 对应 Berlin，Americas 对应 Toronto。
`Message`	原始对话消息或行为输入。	用户原始消息、搜索、筛选、收藏或工具调用结果。

写入时通常从 Message 开始，逐步形成 Facts、Summary 和 Topic。召回时通常从 Topic 找到相关区域，再取回 Summary，必要时补充支撑它的 Facts。

能力	说明
会话 Message 写入	把用户、assistant 或 system 消息写入指定 Session，并进入后续 Memory 处理链路。
行为 Message 写入	记录搜索、筛选、点击、收藏、工具调用和业务事件，补全用户没有直接说出的意图。
Facts 与 Summary 生成	从原始输入中提取可追踪事实，再压缩成更适合长期召回的 Summary。
Topic 分层召回	在新的 Agent 回合中先定位相关 Topic，再召回 Summary 和必要 Facts。
治理与可解释性	保留来源、处理阶段、状态和 webhook 扩展点，方便审计、过滤和业务规则注入。

这条链路的顺序很重要：先召回，再生成，再写回。这样 Agent 使用的是进入本轮前已经沉淀的 Memory，而不是把当前回复误当作历史事实。