126-计算机视觉高级话题（三）：产生式模型【萌萌家】.pdf

下载文档

0
0
约3.25千字
约 5页
2025-03-14 发布于山东
举报
版权申诉
保障服务

126-计算机视觉高级话题（三）：产生式模型【萌萌家】.pdf

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

126|计算机视觉高级话题（三）：产生式模型

2018-09-19洪亮劼来自北京

《AI技术内参》

今天，我们来讨论计算机视觉高级话题中的“产生式模型”（GenerativeModel）。

我们前面讲到的计算机视觉问题，绝大多数场景都是去学习一个“判别式模型”

（DiscriminativeModel），也就是我们希望构建机器学习模型来完成这样的任务，比如判断

某一件事情或一个图片的特征，或者识别图片里面的物体等，这些任务都不需要回答“数据是

如何产生的”这一问题。简言之，针对判断类型的任务，不管是回归还是分类，我们都不需要

对数据直接进行建模。

然而，判别式模型并不能解决所有的机器学习任务。有一些任务的核心其实需要我们针对数据

进行有效的建模，这就催生了“产生式模型”。

产生式模型的一些基础概念

那么，针对数据建模的产生式模型都有哪些基本思想呢？

首先，产生式模型的一个核心思想就是模型要能够产生数据。也就是说，产生式模型不仅需要

针对已有的数据建模，还需要有能力产生新的数据。产生出的这些新数据当然需要和已有的数

据有一定的相似度。换句话说，新产生的数据要能够“以假乱真”。

那么，有哪些能够产生数据的工具呢？

在比较简单的模型中，概率分布其实就起了产生数据的作用。例如，在离散概率分布的世界

里，如果我们知道了一个伯努利分布的参数，也就是某一个事件发生的概率，那么，从理论上

来说，我们就可以模拟出这个事件的发生。

比如，我们利用伯努利分布来对掷硬币产生的正反面建模。一旦我们知道了这个分布的概率是

0.5（或者说是50%），那么，我们从这个分布中产生的数据就可以形成和掷一枚没有偏差的

硬币一样的效果。

同样的道理，如果我们利用正态（或者叫高斯）分布来针对一个连续变量建模，例如某一个地

区的温度，那么一旦我们知道了这个正态分布的均值和方差这两个参数，我们就可以产生所有

温度的可能值。假设温度完全服从这个正态分布，那么就可以认为这些可能值就是以后这个地

区可能出现温度的真实情况。

当然，我们可以看到，简单概率分布无法对真实世界的绝大多数场景进行建模。这也不断激发

研究人员来开发各种更加复杂的概率模型来对真实世界进行描述。

在过去十多年的时间里，一类机器学习思想逐渐成为主流的产生式模型，那就是概率图模型。

顾名思义，概率图模型就是概率论和图论的巧妙结合，以此来对复杂的联合概率分布来进行描

述。

我们今天就不针对概率图模型展开讨论了。你需要了解概率图模型的一个重要特点，那就是能

够利用一个“显示的”表达式来写出这个联合概率分布，不管这个式子本身有多复杂。也就是

说，概率图模型期望能够通过构建复杂的、显示的表达式来完成对真实场景的模拟。

产生式对抗网络

显然，构造一个概率图模型是一个极具挑战的任务，面对复杂的情况，我们都需要写出一个显

示的表达式，或者是针对这种场景的数据来进行模拟。例如，图像和音频信息就是比较复杂的

数据，很难用一个公式（不管这个公式多么复杂）来表达。

那究竟该怎么办？针对这种复杂的数据，研究人员提出了一种新的产生式模型，这就是“产生

式对抗网络”（GenerativeAdversarialNets），简称为GAN[1]。在过去的几年里，这种

模型因其概念简单而备受青睐。

GAN的基本思想是怎样的呢？

首先，我们有一个数据的“产生器”（Generator）。这个产生器的作用是从一个我们可以控

制的模型中产生数据。最终我们的期望是这个产生器能够产生和真实数据一样的数据。

其次，我们有一个数据的“判别器”（Discriminator），其目的是区分数据究竟是真实的数

据还是产生器产生的数据。

GAN的模型训练是一个迭代的过程。最开始，产生器肯定无法真正产生有效的数据，这个时

候，判别器能够很轻松地对产生的数据进行一个评判：哪些是真实数据，哪些不是。但是产生

器会根据这个判别结果，逐渐调整自己产生数据的过程，慢慢地让自己产生的数据趋于真实。

一直到最后，判别器无法分别出数据的真伪。

GAN其实代表了这么一类模型，那就是不再对数据的产生过程进行显式建模，因为这个太过

于困难，而是想办法定义一个流程，通过这个流程产生数据，从而能够直接去对真实数据进行

模拟。

GAN和深度学习的结合点在哪里呢？就是产生器和判别器可以分别是多层的神经网络，甚至

可以是更加复杂的深度学习模型。这样，GAN的学习过程其实也就是两个不同的，各司其职

的深度学习模型参数学习的过程。

在近几年的发展中，基于GAN的各类模型层出不穷，而且能够产生的

您可能关注的文档

文档评论（0）

133****9720 + 关注: 实名认证

内容提供者

物业管理师证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年04月23日上传了物业管理师证

1亿VIP精品文档

更多 >

126-计算机视觉高级话题（三）：产生式模型【萌萌家】.pdf