推荐系统能否避免制造有害的信息茧房？

什么是过滤气泡，它们为何重要？

过滤气泡是指推荐系统反复向你展示与你过往行为相符的内容，从而逐渐缩小你接触多元观点或物品的范围。2023年的一项系统性综述证实，过滤气泡在推荐系统中是真实存在的现象，其成因在于这些系统从用户数据中学习时存在的多重偏差[5]。这一问题之所以重要，是因为它会强化既有观念、降低意外发现的几率，在极端情况下甚至可能传播错误信息或加剧政治极化[5][8]。

有哪些策略已被证明能避免信息茧房？

一种有效的策略是沿着目标维度明确地多样化推荐内容。2022年的一项研究提出了一种名为TD-VAE-CF的方法，该方法在保持其他主题相关性的同时，沿着特定轴（如政治倾向）实现推荐多样化。它优于经典的“最大边际相关性”（MMR）方法，后者往往为了多样性而牺牲相关性[8]。另一种方法赋予用户直接控制权：2022年开发的UCRS系统允许用户实时发出指令调整推荐，并利用因果推断阻断过时的用户表征。实验表明，该系统同时提升了准确性和多样性[6]。

强化学习（RL）提供了第三条路径，它优化的是用户的长期参与度而非即时点击量。2023年的一项研究采用反事实强化学习，在交互式推荐中打破了信息茧房，实现了更好的长期满意度[1]。同样，2023年一种用于推荐项目列表（slates）的生成式强化学习方法，在无需先前方法诸多限制性假设的前提下，提升了推荐内容的多样性[9]。此外，2023年一个基于强化学习的控制框架也证明，它能够重新连接不同社区的用户，从而减少信息茧房造成的隔阂[10]。

一项2024年关于社交媒体用户推荐的研究采用了一种技术，通过重新加权共享关系的损失，在不过度牺牲准确性的前提下提升了推荐多样性[2]。2025年提出的LEAD方法利用大型语言模型生成出人意料但符合现实的推荐项，在推荐质量和多样性方面均优于现有模型[3]。

有哪些权衡与局限？

主要的权衡在于短期准确性（或收入）与长期多样性之间。2022年的一项反事实分析发现，网络推荐系统如果进行更多探索，可以提升长期收入，但这会减少短期收入[4]。同一研究指出，过度探索通常受限于流量，即平台的实验预算有限[4]。

即使是成功的策略也存在局限性。2022年YouTube审计发现，虽然打破信息茧房是可能的，但效果因话题而异，且需要用户主动观看辟谣内容——这是一种刻意的用户行为[7]。2022年的用户可控系统（UCRS）要求用户意识到自己处于信息茧房中并采取行动，但并非所有人都会这样做[6]。2023年的强化学习方法需要精心的离线训练和模拟，其实际部署仍处于起步阶段[1][9]。

本文引用的文献

CIRS：通过反事实交互式推荐系统打破信息茧房

CIRS采用反事实强化学习来打破交互式推荐中的信息茧房，在真实世界数据集（KuaiEnv）上实现了更优的长期用户满意度。

2023 · Chongming Gao, Shiqi Wang, Shijun Li, Jiawei Chen, Xiangnan He, Wenqiang Lei, Biao Li, Yuan Zhang, Peng Jiang · ACM Trans. Inf. Syst.

原文

多样化用户推荐以避免社交媒体社区中的过滤气泡

2024年提出的一种方法通过对共享关系的损失进行重新加权，在社交媒体上实现用户推荐的多样化，在推特数据上显著提升了多样性，同时未大幅牺牲准确性。

2024 · Hiroki Fujiwara, Soh Yoshida, Mitsuji Muneyasu · GCCE

原文

一种缓解协同过滤中过滤气泡的生成式方法

LEAD（2025）利用条件生成对抗网络引导大语言模型生成意外项目，在三个真实世界数据集上，该方法在推荐多样性和分布对齐方面均优于现有模型。

2025 · Chenxi Yang, Hui Wang, Xi Zhou, Hongyue Zhang, Jizhong Han, Xiaodan Zhang · CSCWD

原文

网络推荐系统中的探索权衡

一项2022年的反事实分析表明，网络推荐系统若大幅增加探索性，虽会导致短期收入下降，但能提升长期收入。

2022 · Ricardo Baeza-Yates, Giovanni Delnevo · IEEE Big Data

原文

推荐系统中的过滤气泡：事实还是谬误——一项系统性综述

2023年的一项系统性综述证实，推荐系统中存在由多种偏差驱动的过滤气泡，并发现引入多样性有助于缓解这一问题。

2023 · Qazi Mohammad Areeb, Mohammad Nadeem, Shahab Saquib Sohail, Raza Imam, Faiyaz Doctor, Yassine Himeur, Amir Hussain, Abbes Amira · WIREs Data. Mining. Knowl. Discov.

原文

用户可控的反过滤气泡推荐

UCRS（2022）允许用户通过指令主动控制过滤气泡的缓解过程，利用因果推断实时调整推荐内容，从而同时提升准确性与多样性。

2022 · Wenjie Wang, Fuli Feng, Liqiang Nie, Tat-Seng Chua · SIGIR

原文

审计YouTube推荐算法中的错误信息过滤气泡

2022年的一项YouTube审计发现，用户可以通过观看辟谣内容来突破错误信息的过滤气泡，但其效果因话题而异，且需要用户采取主动行为。

2022 · Ivan Srba, Róbert Móro, Matús Tomlein, Branislav Pecher, Jakub Simko, Elena Stefancova, Michal Kompan, Andrea Hrckova, Juraj Podrouzek, Adrian Gavornik, Mária Bieliková · Trans. Recomm. Syst.

原文

在保持相关性的同时缓解过滤气泡效应

TD-VAE-CF（2022）在保持相关性的同时，沿目标维度（如政治极化）实现推荐多样化，在效率和平衡性上均优于MMR。

2022 · Zhaolin Gao, Tianshu Shen, Zheda Mai, Mohamed Reda Bouadjenek, Isaac Waller, Ashton Anderson, Ron Bodkin, Scott Sanner · SIGIR

原文

基于强化学习的生成式推荐列表

一种2023年提出的生成式强化学习方法，通过将推荐列表编码至连续潜在空间，在放宽先前研究限制性假设的同时提升了推荐多样性。

2023 · Romain Deffayet, Thibaut Thonet, Jean-Michel Renders, Maarten de Rijke · WSDM

原文

打破过滤气泡：可控推荐系统的强化学习框架

一个基于强化学习的2023年控制框架，能够自适应地选择不同用户社区之间的连接，以缓解信息茧房效应，并在大规模真实世界数据集上得到了验证。

2023 · Zhenyang Li, Yancheng Dong, Chen Gao, Yizhou Zhao, Dong Li, Jianye Hao, Kai Zhang, Yong Li, Zhi Wang · WWW

原文