基于网络一致性的对抗样本检测-尹培宇.pdf

下载文档

1
0
约8.23千字
约 33页
2025-04-16 发布于山东
举报
版权申诉
保障服务

基于网络一致性的对抗样本检测-尹培宇.pdf

1、本文档共33页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

BeijingForestStudio

ThenameoftheDepartment

北京理工大学信息系统及安全对抗实验中心

部门名称

基于网络一致性的对抗样本检测

硕士研究生：尹培宇

导师：罗森林

2020年12月20日

内容提要

•背景简介

•基本概念

•算法原理

•应用总结

•参考文献

背景简介

•预期收获

–1.了解人工智能系统面临的安全威胁

–2.了解常见的对抗样本检测方法和原理

–3.了解网络安全领域对抗样本的研究现状

基于网络一致性的对抗样本检测

背景简介

•人工智能安全要素

–完整性（Integrity）：算法模型、数据、基础设施和产品不被恶意植入篡改替换伪

造

–可用性（Availability）：能同时抵御复杂的环境条件和非正常的恶意干扰

–保密性（Confidentiality）：涉及的数据与模型信息不会泄露给没有授权的人；模

型在使用过程中能够保护数据主体的数据隐私

背景简介

•人工智能安全威胁

–保密性威胁

•机器学习即服务（MachineLearningasaService,MLaaS）

•将训练数据编码到模型中

•基于模型逆向生成与私密训练数据相似的数据

–完整性威胁

•篡改训练数据集，使模型“中毒”

–可用性威胁

•异常输入，恶意扰动

•机器学习框架漏洞利用

基于网络一致性的对抗样本检测

基本概念

•后门攻击

–在大多数输入(包括最终作为验证集的输入)上表现良好，但会导致有针对性的误分类

或降低输入具有某些属性(称为后门触发器)时模型的准确性。

–人脸识别、交通标志检测、情感分析、语音识别和自动驾驶

基本概念

•对抗样本生成

–基于梯度的方法：攻击者将生成对抗性样本视为优化问题，并进行梯度引导搜索以

找到对抗性样本

–基于内容的方法：攻击者添加与输入的真实内容语义一致的补丁，以模拟真实世界

的场景。（如图像上的水印和相机镜头上污垢造成的黑点）

基本概念

•对抗样本在其他领域的应用

–文本分类：不改变文本语义

–恶意软件检测：不影响恶意软

您可能关注的文档

文档评论（0）

工业自动化服务 + 关注: 实名认证

内容提供者

24小时提供说明书查找服务。

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于网络一致性的对抗样本检测-尹培宇.pdf