- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
126|计算机视觉高级话题(三):产生式模型
2018-09-19洪亮劼来自北京
《AI技术内参》
今天,我们来讨论计算机视觉高级话题中的“产生式模型”(GenerativeModel)。
我们前面讲到的计算机视觉问题,绝大多数场景都是去学习一个“判别式模型”
(DiscriminativeModel),也就是我们希望构建机器学习模型来完成这样的任务,比如判断
某一件事情或一个图片的特征,或者识别图片里面的物体等,这些任务都不需要回答“数据是
如何产生的”这一问题。简言之,针对判断类型的任务,不管是回归还是分类,我们都不需要
对数据直接进行建模。
然而,判别式模型并不能解决所有的机器学习任务。有一些任务的核心其实需要我们针对数据
进行有效的建模,这就催生了“产生式模型”。
产生式模型的一些基础概念
那么,针对数据建模的产生式模型都有哪些基本思想呢?
首先,产生式模型的一个核心思想就是模型要能够产生数据。也就是说,产生式模型不仅需要
针对已有的数据建模,还需要有能力产生新的数据。产生出的这些新数据当然需要和已有的数
据有一定的相似度。换句话说,新产生的数据要能够“以假乱真”。
那么,有哪些能够产生数据的工具呢?
在比较简单的模型中,概率分布其实就起了产生数据的作用。例如,在离散概率分布的世界
里,如果我们知道了一个伯努利分布的参数,也就是某一个事件发生的概率,那么,从理论上
来说,我们就可以模拟出这个事件的发生。
比如,我们利用伯努利分布来对掷硬币产生的正反面建模。一旦我们知道了这个分布的概率是
0.5(或者说是50%),那么,我们从这个分布中产生的数据就可以形成和掷一枚没有偏差的
硬币一样的效果。
同样的道理,如果我们利用正态(或者叫高斯)分布来针对一个连续变量建模,例如某一个地
区的温度,那么一旦我们知道了这个正态分布的均值和方差这两个参数,我们就可以产生所有
温度的可能值。假设温度完全服从这个正态分布,那么就可以认为这些可能值就是以后这个地
区可能出现温度的真实情况。
当然,我们可以看到,简单概率分布无法对真实世界的绝大多数场景进行建模。这也不断激发
研究人员来开发各种更加复杂的概率模型来对真实世界进行描述。
在过去十多年的时间里,一类机器学习思想逐渐成为主流的产生式模型,那就是概率图模型。
顾名思义,概率图模型就是概率论和图论的巧妙结合,以此来对复杂的联合概率分布来进行描
述。
我们今天就不针对概率图模型展开讨论了。你需要了解概率图模型的一个重要特点,那就是能
够利用一个“显示的”表达式来写出这个联合概率分布,不管这个式子本身有多复杂。也就是
说,概率图模型期望能够通过构建复杂的、显示的表达式来完成对真实场景的模拟。
产生式对抗网络
显然,构造一个概率图模型是一个极具挑战的任务,面对复杂的情况,我们都需要写出一个显
示的表达式,或者是针对这种场景的数据来进行模拟。例如,图像和音频信息就是比较复杂的
数据,很难用一个公式(不管这个公式多么复杂)来表达。
那究竟该怎么办?针对这种复杂的数据,研究人员提出了一种新的产生式模型,这就是“产生
式对抗网络”(GenerativeAdversarialNets),简称为GAN[1]。在过去的几年里,这种
模型因其概念简单而备受青睐。
GAN的基本思想是怎样的呢?
首先,我们有一个数据的“产生器”(Generator)。这个产生器的作用是从一个我们可以控
制的模型中产生数据。最终我们的期望是这个产生器能够产生和真实数据一样的数据。
其次,我们有一个数据的“判别器”(Discriminator),其目的是区分数据究竟是真实的数
据还是产生器产生的数据。
GAN的模型训练是一个迭代的过程。最开始,产生器肯定无法真正产生有效的数据,这个时
候,判别器能够很轻松地对产生的数据进行一个评判:哪些是真实数据,哪些不是。但是产生
器会根据这个判别结果,逐渐调整自己产生数据的过程,慢慢地让自己产生的数据趋于真实。
一直到最后,判别器无法分别出数据的真伪。
GAN其实代表了这么一类模型,那就是不再对数据的产生过程进行显式建模,因为这个太过
于困难,而是想办法定义一个流程,通过这个流程产生数据,从而能够直接去对真实数据进行
模拟。
GAN和深度学习的结合点在哪里呢?就是产生器和判别器可以分别是多层的神经网络,甚至
可以是更加复杂的深度学习模型。这样,GAN的学习过程其实也就是两个不同的,各司其职
的深度学习模型参数学习的过程。
在近几年的发展中,基于GAN的各类模型层出不穷,而且能够产生的
您可能关注的文档
- 055-基于深度学习的搜索算法:深度结构化语义模型【萌萌家】.pdf
- 057-基于深度学习的搜索算法:局部和分布表征下的搜索模型【萌萌家】.pdf
- 058-简单推荐模型之一:基于流行度的推荐模型【萌萌家】.pdf
- 061-基于隐变量的模型之一:矩阵分解【萌萌家】.pdf
- 062-基于隐变量的模型之二:基于回归的矩阵分解【萌萌家】.pdf
- 066-高级推荐模型之三:优化复杂目标函数【萌萌家】.pdf
- 067-推荐的Exploit和Explore算法之一:EE算法综述【萌萌家】.pdf
- 068-推荐的Exploit和Explore算法之二:UCB算法【萌萌家】.pdf
- 070-推荐系统评测之一:传统线下评测【萌萌家】.pdf
- 071-推荐系统评测之二:线上评测【萌萌家】.pdf
最近下载
- 2025版高考英语一轮总复习语境助记选择性必修第三册Unit4AdversityandCourage.doc VIP
- 【推荐】(完整word版)骨伤科常见病及优势病种中医诊疗方案.docx VIP
- 土方开挖与基坑支护及降水工程施工方案.pdf VIP
- 空调维修方案简述.docx
- GNSS 导航器GP-170中文操作说明书.pdf
- 凯恩帝k1tbiii数控系统说明书.docx
- 2025版高考英语一轮总复习选择性必修第三册Unit4AdversityandCourage课件.pptx VIP
- 矿山事故应急救援演练方案.pdf VIP
- 相交线与平行线40道压轴题型专项训练(8大题型)原卷版—2024-2025学年人教版七年级数学下册.pdf VIP
- 骨伤科常见病及优势病种中医诊疗方案文献.docx VIP
文档评论(0)