面向多种学习任务的深度生成模型.pdfVIP

  • 15
  • 0
  • 约16.39万字
  • 约 106页
  • 2021-02-04 发布于江西
  • 举报
摘 要 摘 要 深度神经网络在众多机器学习领域取得了令人瞩目的进展,并被应用到各种 实际场景中。但是,一般的深度神经网络建模一个从输入数据到语义标注的条件 概率模型,这种机制导致了两个瓶颈问题:一方面,深度神经网络忽略了数据中 的不确定性,无法处理数据中可能存在的噪音和缺失信息;另一方面,深度神经 网络的训练需要大量的数据标注,而人工标注在很多实际应用中非常稀少且昂贵。 深度生成模型结合了深度神经网络的灵活性和概率建模框架的推理能力,可以在 完全无标注的情况下建模复杂数据的联合概率分布。因此,深度生成模型是一种 解决深度学习两个瓶颈问题的原则性方法,并将成为未来大数据分析的基础工具。 虽然深度生成模型前景广阔,但是现有模型的表达能力、可解释性和判别性 均有不足之处,亟待解决。具体而言,第一,现有深度生成模型中的网络结构和隐 变量结构都非常简单,这限制了模型的表达能力;第二,现有深度生成模型以完 全黑盒的方式拟合一个从噪音到高维数据的映射,其隐变量可解释性不足,生成 图像的语义也难以控制;第三,无监督学习所提特征的判别能力远逊于前馈神经 网络,而在深度生成模型中恰当地引入监督信号又是一个非平凡问题。本文面向 不同的机器学习任务,设计匹配的模型和学习准则,开发高效的推理和学习算法, 解决上述深度生成模型的关键性研究问题。本文的主要创新点如下: 1. 面向无监督学习,受神经科学启发,提出一个带有记忆模块和注意力机制的 深度生成模型,提高了模型的表达能力和表现;提出对抗变分推理和学习算 法,无需对模型结构作特定假设,提高了一大类无向模型的推理和学习效果。 2. 面向无监督学习和弱监督学习,基于贝叶斯网络和信息传播算法,提出一个 灵活普适的结构化深度生成模型框架,可以生成新的结构化数据并推理给定 数据中的结构化隐变量,增强了深度生成模型的表达能力和可解释性。 3. 面向有监督学习和半监督学习,基于最大间隔学习准则,提出最大间隔深度 生成模型及其变体,极大增强了显式概率模型的判别能力,同时保留了其处 理数据中的噪音和缺失信息的能力。 4. 面向半监督学习,受博弈理论启发,提出了三元生成对抗网络,首次提出半 监督生成对抗网络的最优均衡点并给出证明,显著提高了半监督分类准确率, 并首次在给定部分标注的情况下完成了语义可控的图像合成任务。 关键词:深度生成模型;变分推理;对抗训练;图像合成;有限标注 I 目 录 目 录 第 1 章 绪论 1 1.1 研究背景与意义 1 1.1.1 研究价值 2 1.1.2 应用前景 3 1.2 深度生成模型的定义和分类 6 1.2.1 有向图模型 7 1.2.2 无向图模型 8 1.3 国内外研究现状 8 1.3.1 模型设计 9 1.3.2 边缘信息引入 9 1.3.3 推理和学习算法开发10 1.4 有待解决的研究问题 11 1.5 研究内容与主要贡献13 1.6 本文组织结构 14 第2 章 带有记忆模块的深度生成模型 16 2.1 本章引言16 2.2 模型设计17 2.2.1 整体结构17 2.2.2 单层的记忆模块 18 2.2.3 一个带有层次化记忆模块的例子19 2.3 推理和学习20 2.4 实验 22 2.4.1 密度估计23 2.4.2 模型分析24 2.4.3 图像生成25 2.4.4 缺失信息补全27 2.5 相关工作27 2.6 本章小结28 IV 目 录 第3 章 对抗变分推理和学习算法30 3.1 本章引言30 3.2 本章背景31 3.3 对抗变分推理学习方

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档