- 0
- 0
- 约6.04千字
- 约 4页
- 2026-06-30 发布于湖北
- 举报
DNN解释算法的攻击与防御课题的研究现状文献综述
1.1对DNN解释算法的攻击研究现状
在神经网络模型取得巨大成功的同时,也对DNN解释算法的合理性进行了检验。虽然解释算法的研究越来越受关注,但是不一定都可以取得满意的效果,因此对解释算法的检验方面的研究在近些年逐渐涌现。目前对解释算法的攻击可以分为两大类:改变模型[4,5,6,11,12],改变输入样本[13,14,16,17,19]。本文提出的攻击方法属于第二种。
改变模型攻击解释,也可以分为两类:更新模型权重,完全构造一个操纵模型。更新模型权重是在原始模型的架构上,只涉及对权重的迭代更新。2018年,Adebayo等[4]受统计随机化检验的启发,在NIPS会议上提出了对模型参数或训练标签随机化,开发了简单的测试来检查解释算法的稳定性,表明解释可以通过随机化部分网络权值而改变。2019年,Heo等[5]在NIPS会议中提出对抗性的模型微调,在不损害原始模型准确性的同时,并使用该调整后的模型引导可视化解释热图偏向于特定区域。但是由于是对模型进行了微调,因此需要对模型权重进行重训练,这个过程需要大量的数据进行重训练,需要很长的运算时间,且由于在重训练过程中往往需要对一些参数进行人为的调整,因此进一步消耗了时间,攻击的成本比较高。在2020年,Lakkaraju等[6]发表了攻击解释的另一工作,具体是基于MUSE[7]模型提出了一
您可能关注的文档
- 《“套路贷”的组织特性分析》2500字.docx
- 《2.4G矩形微带天线阵列研究国内外文献综述》2200字.docx
- 《BERT融合CNN、RNN实现复杂场景下微博情绪识别研究》15000字论文.doc
- 《C公司套期保值的效果评价、方案完善以及溢出风险分析案例》3600字.docx
- 《H大学校园足球活动开展现状、问题及对策》5100字.docx
- 《LDPC码的国内外研究历史与现状文献综述》1600字.docx
- 《LNG储罐贫富液充装研究现状的文献综述》2000字.docx
- 《MPPT控制算法研究现状的国内外文献综述》4400字.docx
- 《P2P网贷信用风险的成因和对策国内外研究文献综述》6300字.docx
- 《PLGA微球的制备方法概述》1400字.docx
最近下载
- 2025一年级数学下册无纸笔课件ppt(1).pptx
- 石家庄学院《高等数学(D)》2025 - 2026学年第一学期期末试卷.docx VIP
- 2025室内管道支架及吊架25S402.pdf VIP
- 膝关节病课件PPT.pptx VIP
- B∕T 13402-2019 大直径钢制管法兰(高清可复制).pdf VIP
- 湖南师范大学2024-2025学年第2学期《线性代数》期末试卷(B卷)及参考答案.docx
- 书本打包机机构设计.pdf VIP
- JCT 1011-2021 混凝土抗侵蚀防腐剂.docx VIP
- 2026年江苏无锡市中考化学考试真题及答案.docx VIP
- 《混凝土抗侵蚀防腐剂》.pdf VIP
原创力文档

文档评论(0)