- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
华东师范大学硕士学位论文
摘 要
图像生成模型的学习是计算机视觉领域的一个关键问题。模型旨在拟合图
像数据的分布,使其能够生成不在数据集中但符合分布的新样本。由于图像分布
处于高维空间且十分复杂,该任务具有一定难度。随着深度学习的发展,相继出
现了一系列深度生成模型,其中生成对抗网络(Generative Adversarial Network,
GAN)和变分自编码器(Variational AutoEncoder,VAE)是两种广泛使用的方
法。为控制生成的图像符合指定条件,可在模型中引入额外的条件。本文针对条
件图像生成任务,从增强生成图质量和多样性方面入手,对于条件是类别标签和
图像的情况分别展开研究。本文的研究内容及创新点如下:
(1)对于条件是类别标签的情况,在条件变分自编码器(Conditional Varia
tionalAutoEncoder,CVAE)和条件生成对抗网络(ConditionalGenerativeAdver
sarial Network,CGAN)的混合模型CVAEGAN 的基础上,提出使用两个独立
的编码器将特征空间解混为标签相关和无关两个部分。为解决VAE 中的后验崩
溃问题,在标签相关特征上引入高斯混合分布代替原来的标准高斯分布作为先
验,其中每个高斯项对应一个类别。高斯项的参数由标签监督学习而得。实验在
人脸识别数据集和普适物体数据集上进行,证明了本文方法在图像质量和多样
性上的提升。
(2)对于条件是图像的情况,着眼于人脸多属性编辑任务,基于CGAN 结
构提出使用两个解码器逐步生成并改善属性编辑结果。第一个解码器在每个中
间层输出掩码和残差特征用于改善第二个解码器的特征。同时,为精确控制属性
编辑程度,设计了两阶段训练策略。在第一阶段,输入的二值的属性域标签用于
提供转换方向。在第二阶段,输入不仅反映方向,还包含转换程度,并对生成的
属性插值域图像提出了域一致性损失函数和源域对抗损失函数。在人脸属性数
据集上进行的实验验证了本文方法的有效性。
关键词: 深度学习,变分自编码器,生成对抗网络,图像生成,人脸属性编辑
i
华东师范大学硕士学位论文
ABSTRACT
Learningagenerativemodelfortheimageisacriticalproblemincomputervision.
The model aims to capture the image data distribution for generating new samples.
However,sinceimagesinthehighdimensionspaceoftenlieinacomplexmanifold,it’s
a challenging task. With the development of deep learning, a series of deep generative
models have emerged. Generative Adversarial Network (GAN) and Variational Auto
Encoder (VAE) are two of the most popular methods. To generate images based on a
certaincondition,theconditioncanbeintroducedintothemodel. Thispaperdealswith
conditionalimagegenerationtaskwhentheconditionisaclasslabeloranimage,with
the goal of enhancing the quality and diversity of generated images. The contents and
contributionsareasfollows.
1. When the condition is a class label, we propose to disentangle the latent space
into label relevant
您可能关注的文档
- 基于4C_ID模型的复杂技能学习设计与实践.pdf
- 基于FPGA的多通道磁共振成像信号采集处理平台设计与实现.pdf
- 基于FPGA的万兆以太网TCP_IP卸载引擎与硬件系统设计.pdf
- 基于FPGA的新型数字微镜芯片功能测试系统.pdf
- 基于p型氧化铜的高性能可见-近红外光电探测器.pdf
- 基于RSI的学校信息化改进策略模型构建与应用研究.pdf
- 基于STEAM教育的高中地理整合性课程开发.pdf
- 基于Word2Vec和TF-IDF的课程推荐研究——以干部网络教育培训平台为例.pdf
- 基于ZnS的新型柔性电致发光器件及其湿度敏感特性研究.pdf
- 基于变换光学FDTD方法的目标电磁涂覆和吸波特性研究.pdf
原创力文档


文档评论(0)