Decoupling Semantics and Fingerprints: A Universal Representation for AI-Generated Image Detection

WisPaper

学术搜索

学术问答

价格

TrueCite

工作空间

Home

Blog

Decoupling Semantics and Fingerprints: A Universal Representation for AI-Generated Image Detection

ODP-Net：看透 AI 伪造的本质——通过物理正交解耦实现全能检测

总结

问题

方法

结果

要点

摘要

本文提出了 ODP-Net，一种旨在提升 AI 生成图像检测通用性的深度学习框架。核心方法通过解耦图像特征中的通用伪造痕迹、生成器特定指纹和语义内容，实现了在未知生成架构（如 Stable Diffusion 3）上的 SOTA 检测精度。

TL;DR

针对 AI 生成图像检测在面对新模型（如 Stable Diffusion 3, Flux）时“见光死”的难题，本文提出了 ODP-Net。该方法通过将图像特征“暴力”拆分为通用伪造痕迹、生成器指纹和语义干扰三个正交子空间，成功训练出了一个不被生成器品牌和画面内容干扰的“火眼金睛”。实验表明，它在未知模型上的检测精度高达 99.37%。

1. 痛点：为什么检测器总是“刻舟求剑”？

目前的 AI 检测器在实验室里表现完美，但一旦推向真实世界（跨模型、跨主题）就会失效。

其核心痛点在于特征纠缠 (Feature Entanglement)：

生成器偏见：模型记住了 ProGAN 的条纹或 Diffusion 的高频斑点。
语义偏见：模型误以为“猫”的照片都是真的，“宇航员”的照片都是假的。

作者发现，检测器并不是在学习“真伪”，而是在进行“风格分类”。

2. 洞察：频谱正交性 (Spectral Orthogonality)

作者通过频谱分析发现了一个有趣的物理现象：不同生成器留下的伪造痕迹，其频率分布就像收音机的不同电台频道一样，是非重叠且相互正交的。这意味着，物理上这些信号是可分离的叠加态，这为在特征空间进行“正交分解”提供了理论保证。

频谱正交性分析

3. ODP-Net：三大核心机制

为了实现这种物理上的分离，ODP-Net 设计了三道关卡：

A. 实例感知正交分解 (Instance-aware Orthogonal Decomposition)

不同于以往软性的注意力机制，作者使用了硬掩码 (Hard Masking)。通过门控网络产生互斥的掩码，将特征向量 $z$ 强行拆解为： $z = z_{u} (通用) + z_{s} (特定指纹) + z_{n} (语义噪声)$ 这种“有你没我”的约束确保了信息不会在子空间中泄露。

模型架构图

B. 扰动纯化 (Perturbation-based Purification)

为了进一步洗掉 $z_{u}$ 中残留的语义信息，作者玩了一招“换脸术”：从其他样本中随机抽取语义噪声并注入到当前特征中。如果模型在受到干扰后仍能准确判断真伪，说明它真正掌握了语义不变性。

C. 流形对齐 (Manifold Alignment)

检测器最后通过几何约束，将来自不同生成器的伪造特征“压缩”到同一个原型中心，消除了由于生成算法不同导致的域偏置 (Domain Gap)。

4. 实验战绩：碾压级泛化力

在针对未见过的 generative models 进行测试时，ODP-Net 展现了惊人的稳定性。

跨模型泛化：在 StyleSwim 和 SD3 上的表现远超 FatFormer 和 SAFE。尤其在 WFIR（已经抹除高频指纹的高级 GAN）上，ODP-Net 是唯一能保持 95% 以上精度的模型。
概率校准：不仅判断得准，而且它对自己判断的自信度（NLL 指标）最接近真实情况。

实验结果对比

5. 深度洞察与总结

为什么有效？ ODP-Net 的成功在于它不再试图通过“增加数据”来暴力覆盖所有生成器，而是通过“结构化约束”迫使模型放弃捷径学习 (Shortcut Learning)。

局限性： 虽然在图像领域表现卓越，但在极端恶劣的压缩或多次重采样环境下，通用的伪造痕迹 $z_{u}$ 是否依然能够保持稳定，仍需进一步探讨。

结论： 这项工作证明了：在 AI 对抗领域，架构上的解耦比单纯增加模型深度更有价值。未来的检测器应当更像是一名物理学家，从混杂的信号中精准提取出那道致命的伪造频带。

发现相似论文

试试这些示例

查找最近其他利用频谱分析（Spectral Analysis）或频率域特征来增强 AIGC 检测器泛化能力的论文。
哪篇论文最早在深度学习中提出了 Straight-Through Estimator (STE) 用于离散化掩码生成，本文是如何将其应用于特征解耦的？
有哪些研究探讨了将特征解耦（Feature Disentanglement）技术应用于多模态伪造检测或视频 Deepfake 检测任务中？

ODP-Net：看透 AI 伪造的本质——通过物理正交解耦实现全能检测

1. TL;DR

2. 1. 痛点：为什么检测器总是“刻舟求剑”？

3. 2. 洞察：频谱正交性 (Spectral Orthogonality)

4. 3. ODP-Net：三大核心机制

4.1. A. 实例感知正交分解 (Instance-aware Orthogonal Decomposition)

4.2. B. 扰动纯化 (Perturbation-based Purification)

4.3. C. 流形对齐 (Manifold Alignment)

5. 4. 实验战绩：碾压级泛化力

6. 5. 深度洞察与总结