图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

AI前沿资讯6个月前发布 GOODNAV.NET

1.5K 0 0

来自北京大学的研究团队创新性地开发了一个多模态框架 FakeShield，该框架能够识别图像伪造并定位修改的区域。同时，它基于像素和图像语义的错误提供合理的解释，这一特性可以增强图像伪造检测的可解释性和普适性。

随着生成式人工智能（AIGC）技术的快速发展，图像编辑与合成方法愈加成熟，带来了便捷的内容创作，但同时也显著提高了伪造检测的难度。

用户可通过 Photoshop、DeepFake、AIGC 等工具高质量地编辑图像，且常常不留下可追踪的痕迹。在这样的背景下，准确识别和定位伪造区域成为了学术界和工业界关注的焦点。

尽管当前的图像伪造检测与定位（IFDL）算法在网络设计和训练策略上取得了进展，但依然面临几个主要挑战：

1. 许多方法采用黑箱模型，仅返回真实性概率，缺乏详细的检测解释，导致用户对结果的信任度下降。
2. 现有算法通常针对特定的伪造技术，无法应对各种多样化的篡改方法，从而降低了其实用性。

为解决这些挑战，北京大学与华南理工大学的研究团队提出了一项全新任务：可解释的图像伪造检测与定位（e-IFDL），并设计出创新的多模态伪造检测定位框架 FakeShield，如图 1 所示。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

论文地址：https://arxiv.org/ abs / 2410.02761

项目主页：https://zhipeixu.github.io/ projects / FakeShield/

GitHub 地址：https://github.com/ zhipeixu / FakeShield

FakeShield 结合多模态大语言模型的视觉和语言理解能力，能够在检测图像的真实性和生成篡改区域掩膜的同时，提供详尽的解释，从而提升了检测与定位过程的透明度和泛化能力。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

图 1：(a) 传统 IFDL 方法，(b) 可解释的 IFDL 方法

为了解决现有 IFDL 方法的不足，FakeShield 主要提出了以下贡献：

1. 提出了首个多模态大模型框架用于图像伪造检测与定位，实现了检测与定位过程的解耦，并提供合理的判断依据，解决了当前方法的黑箱问题。
2. 使用 GPT-4o 丰富现有 IFDL 数据集，建立了多模态篡改描述数据集（MMTD-Set），通过关注不同的篡改特征，生成「图像-掩膜-描述」三元组，增强了模型的分析能力。
3. 设计了基于领域标签引导的解释性篡改检测模块（DTE-FDM），在单个模型中检测多种篡改类型，缓解数据域间的冲突问题。同时，通过多模态篡改定位模块（MFLM），对齐视觉和语言特征，实现精准的篡改区域定位。

基于以上创新，FakeShield 不仅提升了伪造检测与定位的准确性和可解释性，还显著增强了模型的适应性和实用性，为图像伪造检测领域提供了一种综合而有效的解决方案。

MMTD-Set 数据集

如图 2 所示，我们依照篡改方式将伪造图像分为 Photoshop、DeepFake、AIGC-Editing 三个数据域。我们利用现有的 IFDL 数据集，运用 GPT-4o 生成关于伪造图像的分析与描述，构建「图像-掩膜-描述」三元组，以便支持模型的多模态训练。此外，针对不同的篡改类型，我们设计了特定的描述提示，引导 GPT 关注不同的像素伪影和语义错误。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

图 2：MMTD-Set 数据集构建过程

在 MMTD-Set 的构建过程中，提示设计是关键环节，确保 GPT-4o 能准确生成与伪造图像相关的高质量描述。当输入编辑后的图像及其二值掩膜时，提示设计围绕定位篡改区域和捕捉可见细节展开。

在定位描述中，GPT-4o 需清晰表达篡改区域的绝对位置和相对位置。绝对位置指篡改区域在整个图像中的位置，如「图像左上角」或「靠近下半部分」。相对位置则要求描述篡改区域与其他物体的关系，如「在桌面上方」或「靠近人群」。这种双重描述设计有助于模型更准确地感知篡改区域，确保输出的掩膜与实际篡改区域一致。

在捕捉可见细节方面，提示重点关注多种视觉异常，这些异常反映了篡改过程中可能产生的伪影和逻辑错误。

对于 Photoshop 修改，提示侧重于像素级伪影和不自然的边缘，要求模型检查光照一致性、像素模糊和分辨率变化，同时判断是否违反物理规律，如缺失阴影或透视关系不合理。在 DeepFake 数据中，提示强调面部细节及语义逻辑，要求模型关注皮肤纹理连贯性、表情自然性及光影匹配，留意面部对称性和眼睛反射异常。

对于 AIGC 编辑，提示则聚焦于文字生成和视觉逻辑，要求分析文字拼写是否准确、排列是否合理，并判断场景中光影与物体位置的合理性。这种针对不同伪造类型的提示设计确保了 FakeShield 在检测与解释上的高效性和准确性。

FakeShield 框架

如图 3 所示，该框架由域标签引导的可解释伪造检测模块（DTE-FDM）和多模态伪造定位模块（MFLM）组成，两者都是关键部分。

DTE-FDM 负责图像伪造检测及结果分析，通过生成数据域标签（domain tag）来缓解不同伪造类型数据间的域冲突，指导多模态大语言模型生成检测结果与判定依据。MFLM 则利用 DTE-FDM 输出的篡改区域描述作为视觉分割模型的提示，帮助其准确定位篡改区域。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

图 3：FakeShield 框架图

Domain Tag-guided Explainable Forgery Detection Module（DTE-FDM）

DTE-FDM 模块负责图像伪造检测与结果分析，通过生成数据域标签以缓解不同伪造类型数据（如 Photoshop、DeepFake、AIGC 编辑）之间的域冲突。这些标签引导多模态大语言模型聚焦于各类篡改特征，实现针对性检测与解释。

在检测过程中，输入图像 I_ori 经数据域标签生成器 G_dt 分配特定标签 T_tag，表明该图像的伪造类型。随后，图像被编码器 F_enc 和线性投影层 F_proj 转换为特征向量 T_img。

这些图像特征与指令文本 T_ins 一起输入 LLM，生成检测结果 O_det，包括是否篡改、具体的篡改区域描述及解释分析。

具体过程如下：

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

DTE-FDM 不仅能够判断图像真实性，还会为不同伪造类型生成详细的判定依据，包括光照一致性、边缘伪影和分辨率差异等。这一设计确保模型能够应用于多样化的伪造场景，增强了检测的准确性与可解释性，使得 FakeShield 在复杂伪造任务中具备更强的泛化能力及实用性。

Multi-modal Forgery Localization Module（MFLM）

MFLM 模块负责精准定位图像中的篡改区域，通过多模态特征对齐的方法，将文本与视觉信息融合，从而生成准确的篡改掩膜。MFLM 的设计旨在解决依赖单一模态信息带来的定位不准确问题，提升对复杂篡改区域的识别能力。

在 MFLM 中，输入图像 I_ori 经 Tamper Comprehension Module (TCM) 编码，将图像特征与解释性文本 O_det 对齐。对齐后的嵌入表示通过多层感知机（MLP）投影为特殊的令牌嵌入，用于指导分割模型生成篡改区域掩膜 M_loc。

整体过程如下：

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

其中，S_enc 和 S_dec 分别是图像的编码器与解码器，Extract (⋅) 用于提取嵌入，通过上述操作，MFLM 根据文本描述与图像特征的对齐生成准确的二值掩膜。

此外，MFLM 采用了 LoRA 微调技术对模型进行轻量化优化，以提升处理效率和降低计算成本。与仅使用单一模态的分割方法相比，这种多模态交互设计使 MFLM 可以应对更加复杂的篡改场景，如光照不一致、透视错误和物体拼接，从而显著提高篡改区域的定位准确性。

实验结果

我们对 FakeShield 在检测、解释和定位方面的性能与多种 IFDL 方法及多模态大语言模型（MLLM）进行了全面对比。为确保结果的公平性，所有 IFDL 方法均在与 FakeShield 相同的数据集上进行了训练与测试。

此次对比涵盖 Photoshop、DeepFake、AIGC 编辑等多种篡改场景，全面评估各模型在多模态信息融合和复杂伪造检测中的表现。

检测性能对比

我们将 FakeShield 与 MVSS-Net、CAT-Net 等其他先进的 IFDL 方法进行了检测性能的对比，结果如表 1 所示。实验结果显示，FakeShield 在 Photoshop、DeepFake 和 AIGC 编辑等数据集上的检测准确率（ACC）和 F1 分数均明显优于其他方法。通过引入领域标签引导策略（domain-tag guidance），FakeShield 能有效处理多种篡改类型，增强跨领域的泛化能力。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

表 1：FakeShield 与主流 IFDL 方法的定位性能比较

解释性能对比

我们通过与预训练的多模态大语言模型（M-LLMs）在 Photoshop、DeepFake 和 AIGC 编辑数据集上的表现进行比较，以评估 FakeShield 的解释能力，结果如表 2 所示。

我们使用余弦语义相似度（CSS）作为衡量指标，FakeShield 在所有测试中均获得最高分数，展现出其生成准确、详细的篡改区域描述的能力。这表明 FakeShield 能够在复杂的篡改场景中生成与真实情况高度一致的解释性描述，极大提升了模型在检测过程中的可解释性与透明度。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

表 2：FakeShield 与主流通用 MLLM 方法的解释性能比较

定位性能对比

我们将 FakeShield 与其他先进的 IFDL 方法在 Photoshop 和 AIGC 编辑等数据集上的表现进行比较，以评估 FakeShield 在篡改区域定位能力，结果如表 3 所示。实验结果显示，FakeShield 在大多数测试集中均获得最高的 IoU 和 F1 分数。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

表 3：FakeShield 与主流 IFDL 方法的定位性能比较

另外，图 4 的主观结果对比也表明，FakeShield 能生成更清晰、更精准的篡改区域分割，准确抓取边界，而其他方法如 PSCC-Net 则容易产生模糊且过于宽泛的预测。

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

图 4：FakeShield 与主流 IFDL 方法的定位性能的定性比较

参考资料：

https://arxiv.org/abs/2410.02761

# AI前沿资讯 # FakeShield # 人工智能

文章版权归作者所有，未经允许请勿转载。

谷歌重申今年 750 亿美元资本支出计划：斥巨资购买芯片、服务器，持续押注生成式 AI

GoodNav.net

375

谷歌开源物种识别 AI 模型 SpeciesNet，助力野生动物研究

GoodNav.net

980

Meta 证实：Ray-Ban 眼镜拍摄的照片和视频会被用于训练 AI 模型

GoodNav.net

1.5K

Meta 人工智能研究负责人将离职，正值公司加大 AI 投入之际

GoodNav.net

870

消息称英伟达重金收购合成数据公司 Gretel，强化生成式 AI 战略布局

GoodNav.net

690

5.28 亿融资砸向杭州具身智能公司：清华叉院机器人天才坐镇，被称为“中国版 Figure”

GoodNav.net

705

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

MMTD-Set 数据集

FakeShield 框架

实验结果

检测性能对比

解释性能对比

定位性能对比

开源文生图 AI 重磅选手上新：Stable Diffusion 3.5 最强全家桶登场、消费级硬件上“开箱即用”

宝马与清华大学成立未来出行联合研究院，聚焦人工智能等前沿技术领域

相关文章

暂无评论

相关文章