- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
BeijingForestStudio
ThenameoftheDepartment
北京理工大学信息系统及安全对抗实验中心
部门名称
针对文本嵌入模型的模型反演
攻击方法研究
硕士研究生皮佳伟
2024年10月27日
问题回溯
•总结反思
–背景部分介绍过于简略
–演讲初期过于紧张,导致听众观感不佳
•相关内容
–2024.01.28皮佳伟《偷走你的训练数据:模型反演攻击方法研究》
–2023.03.05张辰龙《深度神经网络模型窃取检测》
–2022.10.16程瑶《成员推理攻击》
2
内容提要
•预期收获
•题目内涵解析
•研究背景与意义
•研究历史与现状
•知识基础
•算法原理
–Vec2Text
–TransferAttack
•特点总结与工作展望
•参考文献
3
背景简介
•预期收获
–掌握文本嵌入面临的模型反演攻击风险
–理解两种模型反演攻击方法的基本原理
–了解现有方法的缺陷以及未来发展方向
4
内涵解析与研究目标
•题目内涵解析(针对文本嵌入模型的模型反演攻击)
–反演:即逆转,如何由输出得到输入
–模型反演:反演在深度学习模型上的体现
–模型反演攻击:通过特殊设计的算法,重建目标模型的私有训练样本,进而造成
敏感信息的泄露
•研究目标
–面向深度学习模型的隐私安全研究
–研究目标模型特征迁移、解码器训练、生成样本质量评估等关键问题
–结合文本预训练模型、可控文本生成、代理模型训练等理论
–重建目标模型私有训练样本,揭示模型训练数据所面临的隐私安全问题
5
研究背景
•研究背景
–预训练文本嵌入模型已经成为自然语言处理研究中极为重要的一部分
–特定任务的深度学习模型需要特定的数据样本进行训练
–数据样本通常包含各种敏感信息或者所有者涉及知识产权不愿公开
–模型反演攻击能够针对目标模型重建训练数据样本,导致严重的隐私泄露
6
研究意义
•研究意义
–验证文本嵌入模型的数据泄露风险
•由图像领域向文本领域迁移
•验证文本领域面临训练数据泄露风险
–促进防御方法发展
•研究攻击方法在文本领域的应用
•以攻击促进防御手段的发展
•验证已有的防御手段是否可行
重建私有训练样本,促进防御方法发展,保障模型隐私安全
7
研究历史
Fredrikson等人首次提出了模型Song等人针对已有的基于分类Li等人针对已有的研究
文档评论(0)