网站大量收购独家精品文档,联系QQ:2885784924

126-计算机视觉高级话题(三):产生式模型【萌萌家】.pdf

126-计算机视觉高级话题(三):产生式模型【萌萌家】.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

126|计算机视觉高级话题(三):产生式模型

2018-09-19洪亮劼来自北京

《AI技术内参》

今天,我们来讨论计算机视觉高级话题中的“产生式模型”(GenerativeModel)。

我们前面讲到的计算机视觉问题,绝大多数场景都是去学习一个“判别式模型”

(DiscriminativeModel),也就是我们希望构建机器学习模型来完成这样的任务,比如判断

某一件事情或一个图片的特征,或者识别图片里面的物体等,这些任务都不需要回答“数据是

如何产生的”这一问题。简言之,针对判断类型的任务,不管是回归还是分类,我们都不需要

对数据直接进行建模。

然而,判别式模型并不能解决所有的机器学习任务。有一些任务的核心其实需要我们针对数据

进行有效的建模,这就催生了“产生式模型”。

产生式模型的一些基础概念

那么,针对数据建模的产生式模型都有哪些基本思想呢?

首先,产生式模型的一个核心思想就是模型要能够产生数据。也就是说,产生式模型不仅需要

针对已有的数据建模,还需要有能力产生新的数据。产生出的这些新数据当然需要和已有的数

据有一定的相似度。换句话说,新产生的数据要能够“以假乱真”。

那么,有哪些能够产生数据的工具呢?

在比较简单的模型中,概率分布其实就起了产生数据的作用。例如,在离散概率分布的世界

里,如果我们知道了一个伯努利分布的参数,也就是某一个事件发生的概率,那么,从理论上

来说,我们就可以模拟出这个事件的发生。

比如,我们利用伯努利分布来对掷硬币产生的正反面建模。一旦我们知道了这个分布的概率是

0.5(或者说是50%),那么,我们从这个分布中产生的数据就可以形成和掷一枚没有偏差的

硬币一样的效果。

同样的道理,如果我们利用正态(或者叫高斯)分布来针对一个连续变量建模,例如某一个地

区的温度,那么一旦我们知道了这个正态分布的均值和方差这两个参数,我们就可以产生所有

温度的可能值。假设温度完全服从这个正态分布,那么就可以认为这些可能值就是以后这个地

区可能出现温度的真实情况。

当然,我们可以看到,简单概率分布无法对真实世界的绝大多数场景进行建模。这也不断激发

研究人员来开发各种更加复杂的概率模型来对真实世界进行描述。

在过去十多年的时间里,一类机器学习思想逐渐成为主流的产生式模型,那就是概率图模型。

顾名思义,概率图模型就是概率论和图论的巧妙结合,以此来对复杂的联合概率分布来进行描

述。

我们今天就不针对概率图模型展开讨论了。你需要了解概率图模型的一个重要特点,那就是能

够利用一个“显示的”表达式来写出这个联合概率分布,不管这个式子本身有多复杂。也就是

说,概率图模型期望能够通过构建复杂的、显示的表达式来完成对真实场景的模拟。

产生式对抗网络

显然,构造一个概率图模型是一个极具挑战的任务,面对复杂的情况,我们都需要写出一个显

示的表达式,或者是针对这种场景的数据来进行模拟。例如,图像和音频信息就是比较复杂的

数据,很难用一个公式(不管这个公式多么复杂)来表达。

那究竟该怎么办?针对这种复杂的数据,研究人员提出了一种新的产生式模型,这就是“产生

式对抗网络”(GenerativeAdversarialNets),简称为GAN[1]。在过去的几年里,这种

模型因其概念简单而备受青睐。

GAN的基本思想是怎样的呢?

首先,我们有一个数据的“产生器”(Generator)。这个产生器的作用是从一个我们可以控

制的模型中产生数据。最终我们的期望是这个产生器能够产生和真实数据一样的数据。

其次,我们有一个数据的“判别器”(Discriminator),其目的是区分数据究竟是真实的数

据还是产生器产生的数据。

GAN的模型训练是一个迭代的过程。最开始,产生器肯定无法真正产生有效的数据,这个时

候,判别器能够很轻松地对产生的数据进行一个评判:哪些是真实数据,哪些不是。但是产生

器会根据这个判别结果,逐渐调整自己产生数据的过程,慢慢地让自己产生的数据趋于真实。

一直到最后,判别器无法分别出数据的真伪。

GAN其实代表了这么一类模型,那就是不再对数据的产生过程进行显式建模,因为这个太过

于困难,而是想办法定义一个流程,通过这个流程产生数据,从而能够直接去对真实数据进行

模拟。

GAN和深度学习的结合点在哪里呢?就是产生器和判别器可以分别是多层的神经网络,甚至

可以是更加复杂的深度学习模型。这样,GAN的学习过程其实也就是两个不同的,各司其职

的深度学习模型参数学习的过程。

在近几年的发展中,基于GAN的各类模型层出不穷,而且能够产生的

文档评论(0)

133****9720 + 关注
实名认证
内容提供者

物业管理师证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

相关文档