网站大量收购独家精品文档,联系QQ:2885784924

归一化流在表格数据生成中的应用-徐泽豪.pdfVIP

归一化流在表格数据生成中的应用-徐泽豪.pdf

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

BeijingForestStudio

ThenameoftheDepartment

北京理工大学信息系统及安全对抗实验中心

部门名称

归一化流在表格数据生成中的应用

硕士研究生徐泽豪

2024年04月06日

问题回溯

•总结反思

–PPT部分内容制作不严谨,未介绍前沿算法

–详略不得当,基础知识部分占比过多

–算法讲解部分未标注符号含义

•相关内容

–2023.04.16万韵伟:《扩散模型加速采样方法与应用》

–2023.08.14徐泽豪:《表格数据生成:GAN的演进与未来》

–2023.11.06吴肖龙:《智能模型的不确定性估计》

–2024.01.07段学明:《DNN中的理论可解释性》

2

内容提要

•预期收获

•题目内涵解析

•研究背景与意义

•研究历史与现状

•知识基础

•算法原理

–DP-Hflow

–CeFlow

•特点总结与工作展望

•参考文献

3

预期收获

•预期收获

–1.理解归一化流模型的基本概念

–2.理解归一化流模型在表格数据生成相关任务中的基本应用

–3.了解归一化流模型的前沿发展

4

目标内涵

•研究目标

–以表格数据为研究对象,面向隐私保护/反事实解释任务

–结合归一化流、变分去量化、条件流高斯混合模型技术

–探讨归一化流如何提高表格数据概率建模相关应用的准确性

•内涵解析

–表格数据:以行和列的形式存储的结构化数据,每列代表一维属性,每行代表一

条数据样本

–归一化流:利用一系列可逆变换将简单分布映射为复杂数据分布的生成模型,具

有精确计算概率密度的能力

–概率建模:精确捕获和表达数据的复杂分布特性,为后续的数据生成、分析和预

测等下游任务建立基础

5

背景意义

•研究背景

–表格数据在商业智能、医疗健康、金融分析等领域广泛应用

–这些领域的复杂数据分布特性对概率建模提出了挑战

•研究意义

–通过精准映射简单分布至复杂分布,对于理解和模拟真实数据复杂性,改进数据

生成质量、增强模型解释性具有重要作用

–直接使用真实表格数据进行研究或商业分析面临隐私泄露风险,需要在不泄露个

人隐私的前提下利用敏感数据

–现有的机器学习模型缺乏足够的透明度和解释性,为表格数据生成反事实样本有

助于揭示模型决策背后的因果关系,具有重要的实用价值

6

研究历史

Rezende等人通过将简单Grover等人提出了Flow-Izmailov等人提出半监督学Lee等人通过结合差分隐私和

的初始密度通过一系列可GAN,结合最大似然和对习方法FlowGMM,融合归归一化流模型提出了一种表格

逆变换转换成更复杂的

文档评论(0)

说明书文档库 + 关注
实名认证
文档贡献者

提供说明书查找服务。

1亿VIP精品文档

相关文档