MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation

WisPaper

Scholar Search

Scholar QA

Pricing

TrueCite

Workspace

Home

Blog

MASS-RAG: Multi-Agent Synthesis Retrieval-Augmented Generation

MASS-RAG：多智能体协作视角下的 RAG 系统深度进化

Summary

Problem

Method

Results

Takeaways

Abstract

本文提出了 MASS-RAG，一种用于检索增强生成（RAG）的多智能体合成框架。该方法通过部署专门的摘要（Summarizer）、提取（Extractor）和推理（Reasoner）智能体，从不同维度过滤检索到的噪声上下文，并由合成智能体（Synthesis Agent）整合各方证据以生成最终答案。

TL;DR

在检索增强生成（RAG）领域，如何从海量且有噪声的检索结果中精准“捞”出正确答案一直是痛点。北京理工大学与清华大学的研究团队提出了 MASS-RAG，通过角色专业化的多智能体（Summarizer, Extractor, Reasoner）对证据进行多维度过滤，并由 Synthesis Agent 进行最终裁决，实现了 RAG 鲁棒性的跨越式提升。

痛点深挖：单打独斗的 RAG 瓶颈

目前的 RAG 系统虽然能为 LLM 提供外部知识，但在实际应用中经常遇到“噪声干扰”。现有的主流方法（如 Self-RAG）往往依靠模型自身的反思能力或单一的过滤逻辑。

核心挑战在于：

证据分布零散：正确答案往往需要结合多个文档的细节。
信息异构性：有的证据需要字面提取（Extractive），有的需要归纳总结（Abstractive），有的则需要逻辑推演（Reasoning）。
视角单一：现有的过滤智能体通常从单一维度看问题，容易漏掉隐藏在角落的细微线索。

架构解析：多元证据视图的合成

MASS-RAG 的核心创新在于其 Multi-Agent Synthesis 流程。它不再让 LLM 直接根据检索结果写答案，而是先派遣“三剑客”进行预处理：

Summarizer (摘要员)：负责语义压缩，保留全局关键信息。
Extractor (提取员)：像搬运工一样，原封不动地抠出支撑事实的句子。
Reasoner (推理员)：负责“脑补”文档间的逻辑链条，找出隐藏联系。

模型架构图 图 1：MASS-RAG 的总体架构，展示了多智能体过滤与答案合成的流程。

这种设计的妙处在于：每种模型都有自己的 Inductive Bias（归纳偏置）。例如，对于事实性问题，Extractor 的权重更高；而对于复杂的开放式问题，Reasoner 的见解至关重要。

实验战绩：全线飘红的 SOTA

研究团队在 TriviaQA、PopQA、ARC-C、ASQA 四个极具代表性的基准上进行了测试。结果显示，MASS-RAG 在无需任何微调（Training-free）的情况下，展现出了惊人的泛化能力。

实验结果对比 表 1：MASS-RAG 与主流 RAG 方法的性能对比，可见其在各项指标上均实现了 SOTA。

关键洞察：

对低质检索的韧性：即使在检索到的 Top-K 文档较少时，MASS-RAG 依然能通过深度过滤保持高准确率。
智能体互补性：通过分析发现，三个过滤智能体捕捉到的正确证据重合度并不高，这意味着它们确实从不同视角“救回”了不同的关键信息。

深度洞察：为什么这种合成有效？

从学术角度看，MASS-RAG 的成功验证了 “显式证据表示” 的重要性。在传统的 RAG 中，中间过程是不透明的。而在 MASS-RAG 中，Synthesis Agent 在做出最终判断前，已经看过了“缩减版摘要”、“原始证据片段”和“逻辑推理链”。这种 多模态中间表征（Heterogeneous Intermediate Representations） 大大降低了模型产生幻觉（Hallucination）的风险，因为它强迫模型在不同角色生成的“答案快照”中进行相互验证。

局限性与展望

尽管表现强劲，MASS-RAG 也面临 计算成本 的挑战。对比单次生成的 RAG，它需要进行多次 Agent 调用。未来的优化方向可能集中在如何将多智能体的知识“蒸馏”到单一轻量化模型中，或采用动态决策模型，仅在必要时才启用复杂的推理智能体。

总结而言，MASS-RAG 为 RAG 系统提供了一个全新的范式：与其期待一个万能的过滤器，不如构建一支专家团队。

Find Similar Papers

Try Our Examples

查找最近其他利用多智能体协作（Multi-Agent Collaboration）来解决长文本 RAG 或复杂推理问题的论文。
哪篇论文最早探讨了检索增强生成中的单一视角过滤局限性，本文提出的三种专家智能体角色（摘要、提取、推理）是如何定义其各自的 Inductive Bias 的？
有哪些研究关注 RAG 框架中 Synthesis Agent 的冲突解决机制，特别是当不同检索段落提供相互矛盾的信息时如何决策？

Contents

MASS-RAG：多智能体协作视角下的 RAG 系统深度进化

1. TL;DR

2. 痛点深挖：单打独斗的 RAG 瓶颈

3. 架构解析：多元证据视图的合成

4. 实验战绩：全线飘红的 SOTA

5. 深度洞察：为什么这种合成有效？

6. 局限性与展望