基于输入输出扰动的模型窃取防御方法-张辰龙.pdfVIP

下载本文档

0
0
约1.5万字
约 27页
2025-04-16 发布于山东
举报
版权申诉

基于输入输出扰动的模型窃取防御方法-张辰龙.pdf

1、本文档共27页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

BeijingForestStudio

ThenameoftheDepartment

北京理工大学信息系统及安全对抗实验中心

部门名称

基于输入输出扰动的模型窃取防御方法

硕士研究生张辰龙

2024年07月14日

问题回溯

•总结反思

–增加一些基础性知识，保证讲解的完整性

–部分地方语速偏快，可以适当进行调整，把控整体节奏

–语音语调较为平缓，学习找到讲解的感觉，抓住听众的注意力

•相关内容

–2023.09.17张辰龙《深度神经网络模型窃取防御方法》

–2023.03.12邢凤桐《深度神经网络模型水印保护方法》

–2023.03.05张辰龙《深度神经网络模型窃取检测》

–2021.01.03王琛《深度神经网络对抗样本防御方法》

内容提要

•预期收获

•题目内涵解析

•研究背景与意义

•研究历史与现状

•知识基础

•算法原理

–APGP

–APMSA

•特点总结与工作展望

•参考文献

预期收获

•预期收获

–了解深度神经网络模型防御整体框架

–理解深度神经网络模型窃取防御的算法原理及其理论问题

–通过学习最优化问题的构建、求解、优化思路，为其他研究方向提供灵感

–了解深度神经网络模型窃取防御的重要意义

目标内涵

•研究目标

–通过对模型的输入输出进行修改，减小查询样本引发的信息泄露

–降低攻击者窃取所得替代模型的预测准确率

•题目内涵解析查询样本

–模型窃取防御的三类方式云端模型

•扰动输入、扰动输出、扰动模型决策边界

预测向量

–输入扰动

•将输入样本经过修改后再经过模型预测

•通过更大的噪音覆盖掉攻击者精心设计的微小扰动

–输出扰动

•将输出预测向量进行修改，提供错误的或具有误导性的预测向量

背景意义

•研究背景

–部署在云端的模型（黑盒），向用户提供查询接口

–攻击者：构造样本→利用查询接口获得预测向量→利用样本、向量训练本地模型

•研究意义

–保护权益：模型训练需要很大的代价，模型拥有者通过向每次查询收费来收回成

本，窃取模型后可以绕过付费查询

–保护隐私：窃取后的模型与原模型具有相似的决策边界，可以为对抗样本攻击、

成员推理攻击、模型反演攻击等提供跳板

–保护知识产权：保证深度神经网络模型的知识产权，促进数据共享

研究历史

您可能关注的文档

基于图神经网络的二进制程序函数相似性检测-邢继媛.pdf

文档评论（0）

***** + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于输入输出扰动的模型窃取防御方法-张辰龙.pdfVIP