- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
BeijingForestStudio
ThenameoftheDepartment
北京理工大学信息系统及安全对抗实验中心
部门名称
基于网络一致性的对抗样本检测
硕士研究生:尹培宇
导师:罗森林
2020年12月20日
内容提要
•背景简介
•基本概念
•算法原理
•应用总结
•参考文献
2
背景简介
•预期收获
–1.了解人工智能系统面临的安全威胁
–2.了解常见的对抗样本检测方法和原理
–3.了解网络安全领域对抗样本的研究现状
3
基于网络一致性的对抗样本检测
背景简介
背景简介
•人工智能安全要素
–完整性(Integrity):算法模型、数据、基础设施和产品不被恶意植入篡改替换伪
造
–可用性(Availability):能同时抵御复杂的环境条件和非正常的恶意干扰
–保密性(Confidentiality):涉及的数据与模型信息不会泄露给没有授权的人;模
型在使用过程中能够保护数据主体的数据隐私
5
背景简介
•人工智能安全威胁
–保密性威胁
•机器学习即服务(MachineLearningasaService,MLaaS)
•将训练数据编码到模型中
•基于模型逆向生成与私密训练数据相似的数据
–完整性威胁
•篡改训练数据集,使模型“中毒”
–可用性威胁
•异常输入,恶意扰动
•机器学习框架漏洞利用
6
基于网络一致性的对抗样本检测
基本概念
基本概念
•后门攻击
–在大多数输入(包括最终作为验证集的输入)上表现良好,但会导致有针对性的误分类
或降低输入具有某些属性(称为后门触发器)时模型的准确性。
–人脸识别、交通标志检测、情感分析、语音识别和自动驾驶
8
基本概念
•对抗样本生成
–基于梯度的方法:攻击者将生成对抗性样本视为优化问题,并进行梯度引导搜索以
找到对抗性样本
–基于内容的方法:攻击者添加与输入的真实内容语义一致的补丁,以模拟真实世界
的场景。(如图像上的水印和相机镜头上污垢造成的黑点)
9
基本概念
•对抗样本在其他领域的应用
–文本分类:不改变文本语义
–恶意软件检测:不影响恶意软
您可能关注的文档
- 基于图神经网络的中文短文本匹配方法-杨俊楠.pdf
- 基于协同过滤的推荐算法-赵惟肖-2018-08-26-19_00_00.pdf
- 极端多标签文本分类-马西洋.pdf
- 加密移动流量分析方法-吴泽瀚.pdf
- 健康365手机软件蓝牙连接说明2.pdf
- 健康365手机软件数据上传步骤.pdf
- 跨语言命名实体识别-刘小丫.pdf
- 匮乏资源命名实体识别-吴杭颐.pdf
- 蓝牙&2.4G设置手册-V4.4.pdf
- 利用差分隐私噪声扰动的单词替换方法-关业礼.pdf
- 中考语文复习专题二整本书阅读课件.ppt
- 中考语文复习积累与运用课件.ppt
- 2025年初中学业水平考试模拟试题(二)课件.ppt
- 四川省2015届理科综合试题48套第12套.pdf
- 【课件】战争与和平—美术作品反映战争+课件-2024-2025学年高中美术湘美版(2019)美术鉴赏.pptx
- 【课件】青春牢筑国家安全防线 课件 2024-2025学年高中树立总体国家安全观主题班会.pptx
- 【课件】原始人的创造+课件高中美术湘美版(2019)美术鉴赏.pptx
- 上海证券-美容护理行业周报:流量加快去中心化,强运营头部品牌影响较小 -2024-.pdf
- T_CSEIA 1005—2023_能源工业互联网平台数据治理要求.pdf
- T_CDSA 504.16-2023_急流救援技术培训与考核要求.pdf
文档评论(0)