- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
中国科学:信息科学2025年第55卷第2期:343–355
SCIENTIASINICAInformationis
论文
论文
《中国科学》杂志社SCIENCECHINAPRESS
crossMark
适应视觉语言模型实现通用深度伪造检测
刘波1,贺庆辉1,魏杨1,毕秀丽1*,马建峰2,肖斌1
1.重庆邮电大学计算机科学与技术学院重庆市图像认知重点实验室,重庆400065
2.西安电子科技大学网络与信息安全学院,西安710071
*通信作者.E-mail:bixl@
收稿日期:2024–09–23;修回日期:2024–11–19;接受日期:2024–12–03;网络出版日期:2025–01–20
国家自然科学基金(批准号:和重庆市杰出青年科学基金(批准号:CSTB2022NSCQ-JQX0001)资助项目
摘要随着生成网络的快速发展,信息的真实性正面临前所未有的挑战,该技术的滥用可能导致虚假图像泛滥,严重侵蚀图像的可信度.如果这些虚假图像未经检测就被用于科研、新闻、司法等领域,将误导公众认知,挑战科学结论.因此,开发出高效的图像真实性检测技术已成为当务之急.当前的研究侧重于使用大规模生成图像数据集来训练检测器,然而,这些基于大量数据训练的方法通常计算成本高,并且在处理未见过的生成图像时表现出有限的泛化能力.在本文中提出了一种基于少样本学习的方法用于检测AI生成的图像.为了捕捉高级语义信息,本文利用预训练的CLIP模型提取视觉特征.鉴于现有模型在生成图像表征学习方面的不足,设计了一种新的自适应伪造检测算法.该方法通过在CLIP模型上引入两项关键设计,以增强其对更广泛伪造表征的学习能力.首先,与之前仅使用视觉编码器的研究不同,此处同时使用了CLIP模型的图像和文本编码器,以充分发挥其性能.其次,采用简单且轻量的提示词优化策略,使CLIP模型更好地适应伪造表征,只需少量训练数据即可显著提升性能.此外,考虑到现有研究仅关注单一生成模型的图像训练场景,提出了一种无需训练的方法,通过引入更高级生成模型的图像知识,大幅提升了模型的泛化能力.实验结果表明,依靠这两种设计,所提出的方法在多个公开数据集上的平均检测准确率超过了现有最先进技术10.82%.
关键词图像取证,伪造检测,生成模型,生成图像,迁移学习,视觉语言模型
1引言
随着深度学习技术的迅猛发展,各种复杂的生成模型如生成对抗网络[1]及其变体(如BigGAN[2],CycleGAN[3],ProGAN[4],StarGAN[5],StyleGAN[6],StyleGAN2[7])和扩散模型[8]及其变体(如CDM[9],GDM[10],SDM[11])也得到了显著推进.这些模型能够创造出既逼真又具有高度创造性的图像,如图1所示,真实世界中相机捕获的图像(图1(a)~(g))与由生成模型生成的图像(图1(h)~(n))展示了相似的视觉真实感.这不仅体现了生成模型的强大能力,也引发了广泛的社会讨论和关注.然
引用格式:刘波,贺庆辉,魏杨,等.适应视觉语言模型实现通用深度伪造检测.中国科学:信息科学,2025,55:343–355,doi:10.1360/SSI-2024-0289
LiuB,HeQH,WeiY,etal.Adaptingvision-languagemodelsforuniversalgeneratedimagedetection.SciSinInform,2025,55:343–355,doi:10.1360/SSI-2024-0289
?c2025《中国科学》杂志社
/doi/10.1360/SSI-2024-0289
刘波等中国科学:信息科学2025年第55卷第2期344
图1(网络版彩图)不同来源的真实图像和生成图像.(a)~(g)为真实图像,来自ImageNet,LSUN和FFHQ等数据集;(h)~
您可能关注的文档
- 虹软科技(688088)智驾和端侧AI两翼齐飞,ArcMuse激发新活力.docx
- 互联网传媒-美股互联网传媒跟踪专题报告(二十五):美股科技巨头24Q4业绩解读:加码资本开支和AI投入,25年增长动力在哪里,.docx
- 化工行业行业周报:石油焦、有机硅DMC价格上涨,看好成长属性标的.docx
- 化工行业周报:锦纶FDY、石油焦、腈纶短纤、涤纶DTY等价格涨幅居前.docx
- 环保行业跟踪周报:欧盟终裁略下调对华生柴反倾销关税,开始跟踪SAF进口,持续推荐现金流资产.docx
- 黄金有望迎来长期增量资金- 基金研究 20250217 -中信建投 .docx
- 基础化工-行业周报:国常会研究提振消费及化解重点产业结构性矛盾,继续关注化工核心资产及新材料成长.docx
- 基于AHP-云模型的装备工程研制风险评价研究.docx
- 基于RIS 相位一致性算法的数据通信时延分布建模与最优调控.docx
- 基于STK的Starlink星座覆盖仿真分析.docx
- 2025年春新人教版8年级物理下册全册教学课件.pptx
- 2025年春新人教版英语7年级下册全册课件 (2).pptx
- 九年级数学上册2413弧弦圆心角省公开课一等奖百校联赛赛课微课获奖课件.pptx
- 中考历史总复习专题专题2近现代中国人民的抗争探索史省公开课一等奖百校联赛赛课微课获奖课件.pptx
- 中国人口研究专题报告—中国2025-2100年人口预测与政策建议.docx
- CEEM-2024年冬季全球宏观经济季度报告.docx
- 八年级语文下册第六单元21诗词五首课件省公开课一等奖新课获奖课件.pptx
- 中考语文总复习语文知识及应用专题5仿写修辞含句子理解市赛课公开课一等奖省课获奖课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第二课《藏猫猫》精品课件.pptx
- 湖南文艺版(2024)新教材一年级音乐下册第三课《我向国旗敬个礼》精品课件.pptx
文档评论(0)