Governed Memory: A Production Architecture for Multi-Agent Workflows

WisPaper

Scholar Search

Scholar QA

Pricing

TrueCite

Workspace

Home

Blog

Governed Memory: A Production Architecture for Multi-Agent Workflows

[论文解读] Governed Memory: 突破 RAG 瓶颈，构建多智能体协作的工业级“内存治理层”

Summary

Problem

Method

Results

Takeaways

Abstract

本文提出了 Governed Memory，一种面向生产环境的多智能体工作流内存与治理层。该架构通过双重内存模型（原子事实+架构化属性）与分层治理路由，在保证 99.6% 事实召回率的同时，实现了 100% 的合规性拦截与 SOTA 级别的长短期记忆性能（LoCoMo 榜单 74.8%）。

TL;DR

在企业 AI 场景中，部署几十个智能体（Agent）已是常态，但它们往往像“断了线的风筝”——彼此不共享记忆，且不受统一政策约束。本文提出的 Governed Memory 架构填补了这一空白。它通过 Dual Memory（双重存储） 和 Progressive Delivery（渐进式交付） 等机制，将零散的 RAG 升级为受控的、可结构化利用的企业资产，在大幅提升准确度的同时节省了 50% 的 Token 成本。

1. 痛点：为什么 RAG 在生产环境中会失效？

传统的 RAG（检索增强生成）是一个单点的检索原语，但在生产级多智能体流程中，它面临五个“结构性阻碍”：

记忆孤岛：销售 Agent 发现的客户痛点，续约 Agent 却看不见。
治理碎片化：合规政策更新了，却无法同步到分布在不同团队的 10 多个 Agent 提示词中。
非结构化陷阱：纯文本记忆能增强提示词，却不能直接填入 CRM 字段或驱动自动化工作流。
上下文冗余：Agent 在多步自主循环中重复加载相同的策略，挤占了推理用的 Context Window。
质量退化：由于缺乏 Schema 监控，数据随着时间推移悄悄变质。

2. 核心架构：Governed Memory 的四层防御

作者认为，单纯提高检索相关性是不够的。Governed Memory 建立了一个四层架构：

2.1 双重内存模型 (Dual Memory Model)

系统不再只存 Vector，而是同步存储两类数据：

Open-set Memory：原子化的事实（如“客户提到他们在评估三个供应商”）。
Schema-enforced Memory：带类型的属性（如 deal_value: 450000）。这种设计确保了 38% 的长尾见解（纯事实）和 12% 的硬性业务数据（存储属性）互不遗漏。

模型架构图

2.2 渐进式上下文交付 (Progressive Context Delivery)

这是针对自主 Agent 的独创设计。以往 Agent 每走一步都要带上厚厚的“说明书”，而 Governed Memory 会维护一个 Session 状态，只推送 Agent 还没看过的增量（Delta）信息。这种“按需加载”将 Token 消耗降低了约 50.3%。

3. 实验战绩：工业级的严谨性

论文在 Personize.ai 的生产环境中进行了验证，数据非常亮眼：

事实召回率：高达 99.6%，且通过双模态覆盖（Dual-modality）捕获了单一系统会丢失的信息。
隔离与安全：在 3800 次针对 100 个相似实体的对抗性查询中，通过 CRM 键前置过滤实现了 零泄露。
冲突解决：利用指数级时间衰减（半衰期 38 天），系统能准确识别过时信息（如公司已更换数据库），冲突检测准确率达 83.3%。

实验结果对比

在 LoCoMo（长文本解析）测评中，该架构整体准确率为 74.8%，在开放式推断上甚至超越了人类水平，这证明了引入治理和 Schema 不仅不会降低检索性能，反而通过提供“高质量信号”提升了逻辑推理上限。

4. 深度洞察：AI 辅助的 Schema 进化

本文最具有工程参考价值的地方在于 Schema 的闭环管理。Schema 不是静态的，系统提供了分析流程：

回放提取：观察当前 Schema 表现。
诊断判断：AI 自动指出哪些字段提取失败或置信度低。
自动优化：AI 重新生成更精确的描述符。这种通过自评价（Self-evaluation）驱动的进化，解决了生产环境中“数据漂移”导致的性能下降。

5. 总结与反思

Governed Memory 的出现标志着 Agent 架构从“玩具”向“基础设施”的转型。

启发：RAG 只是开始，治理才是终点。对于企业开发者，与其纠结于向量数据库的精微调整，不如思考如何建立一套跨 Agent 的共享 Schema 和 Session 状态管理机制。
局限性：目前的质量门控（Quality Gates）多基于启发式规则，在高并发写冲突（多个 Agent 同时写同一实体）情况下的表现仍有待进一步大规模验证。

随着自治 Agent 深入企业运营的核心，准确度和合规性将成为核心竞争力。Governed Memory 为这一趋势提供了一个可靠的底座。

Find Similar Papers

Try Our Examples

查找最近其他关于多智能体共享内存协同（Shared Memory for Multi-Agent Systems）及其冲突解冲突机制的论文。
哪篇论文最早提出了 MemGPT 或类似将 LLM 视为操作系统的内存管理概念，本文的“治理层”与其有何演进关系？
有哪些研究探讨了如何将受 Schema 约束的结构化提取与非结构化 RAG 结合以提升下游业务系统的自动化水平？

Contents

[论文解读] Governed Memory: 突破 RAG 瓶颈，构建多智能体协作的工业级“内存治理层”

1. TL;DR

2. 1. 痛点：为什么 RAG 在生产环境中会失效？

3. 2. 核心架构：Governed Memory 的四层防御

3.1. 2.1 双重内存模型 (Dual Memory Model)

3.2. 2.2 渐进式上下文交付 (Progressive Context Delivery)

4. 3. 实验战绩：工业级的严谨性

5. 4. 深度洞察：AI 辅助的 Schema 进化

6. 5. 总结与反思