- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
深度生成模型
DeepGenerativeModels《神经网络与深度学习》2025
参考《神经网络与深度学习》-深度生成模型一些例子来自于李宏毅《IntroductionofGenerativeAdversarialNetwork(GAN)》
生成模型
GenerativeModels
机器学习的两种范式
生成模型:一系列用于随机生成可观测数据的模型生成模型包含两个步骤:密度估计采样
生成数据的另一种思路
深度生成模型深度生成模型就是利用神经网络构建生成模型。变分自编码器(VariationalAutoencoder,VAE)[KingmaandWelling,2013,Rezendeetal.,2014]生成对抗网络(GenerativeAdversarialNetwork,GAN)[Goodfellowetal.,2014]
变分自编码器
VariationalAutoencoder,VAE
含隐变量的概率图模型生成数据x的过程可以分为两步进行:根据隐变量的先验分布p(z;θ)采样得到样本z;根据条件分布p(x|z;θ)采样得到x。概率生成模型
EM算法回顾给定一个样本x,其对数边际似然logp(x|θ)可以分解为EstepMstep
变分自编码器的模型结构可以分为两个部分:寻找后验分布p(z|x;θ)的变分近似q(z|x;??);变分推断:用简单的分布q去近似复杂的分p(z|x;θ)在已知q(z|x;??)的情况下,估计更好的分布p(x|z;θ)。变分自编码器(VAE)用神经网络来替代
变分自编码器
推断网络推断网络目标
生成网络先验分布p(z|θ)一般假设隐变量z的先验分布为各向同性的标准高斯分布N(z|0,I)条件概率分布p(x|z,θ)假设p(x|z,θ)服从对角化协方差的高斯分布目标
模型汇总再参数化
再参数化分布q(z|x,?)依赖于参数?再参数化(reparameterization)是实现通过随机变量实现反向传播的一种重要手段??
变分自编码器的训练过程
变分自编码器学习到的隐变量流形
生成对抗网络
GenerativeAdversarialNetwork(GAN)
显式密度模型和隐式密度模型显式密度模型显示地构建出样本的密度函数p(x|θ),并通过最大似然估计来求解参数;变分自编码器、深度信念网络隐式密度模型不显示地估计出数据分布的密度函数但能生成符合数据分布pdata(x)的样本无法用最大似然估计
生成网络生成网络从隐空间(latentspace)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。如何学习生成网络?
生成网络示例生成网络?生成网络?生成网络?生成网络?Eachdimensionofinputvectorrepresentssomecharacteristics.LongerhairbluehairOpenmouth
判别网络判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。判别网络判别网络判别网络判别网络1.01.00.1?
MinMaxGame对抗训练生成网络要尽可能地欺骗判别网络。判别网络将生成网络生成的样本与真实样本中尽可能区分出来。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。
生成网络v3生成网络v2对抗过程生成网络(student)判别网络(teacher)生成网络v1判别网络v1判别网络v2NoeyesNomouth
MinMaxGame判别网络生成网络MinimaxGame
训练过程
AnimeFaceGeneration100updates1000updates
AnimeFaceGeneration2000updates5000updates
AnimeFaceGeneration10,000updates50,000updates
一个具体的模型:DCGANs判别网络是一个传统的深度卷积网络,但使用了带步长的卷积来实现下采样操作,不用最大汇聚(pooling)操作。生成网络使用一个特殊的深度卷积网络来实现使用微步卷积来生成64×63大小的图像。
DCGANs
模型分析
数据分布????Intheend……realgenerated
模型分析?
不稳定性:生成网络的梯度消失?使用JS散度来训练生成对抗网络的一个问题是当两个分布没有重叠时,它们之间的JS散度恒等于常数log2。对生成网络来说,目标函数关于参数的梯度为0。
模型坍塌:生成网络的“错误”目标生成网络的目标函数其中后两项和生成网络无关,因此
前向和逆向KL散度?前向KL散度逆向KL散度
企业信息管理师持证人
新能源集控中心项目 智慧电厂建设项目 智慧光伏 智慧水电 智慧燃机 智慧工地 智慧城市 数据中心 电力行业信息化
文档评论(0)