EM算法推导与GMM的训练应用.pdf

下载文档 降价啦

7
0
约8.44千字
约 16页
2017-10-07 发布于湖北
举报
版权申诉
保障服务

EM算法推导与GMM的训练应用.pdf

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

EM算法推导与GMM的训练应用

EM 算法与GMM 2014 EM算法与 GMM insmod 2014 年 4 月注：本文主要参考Andrew Ng 的 Lecture notes 8 ，并结合自己的理解和扩展完成。 GMM 简介 GMM(Gaussian mixture model) 混合高斯模型在机器学习、计算机视觉等领域有着广泛的应用。其典型的应用有概率密度估计、背景建模、聚类等。图1 GMM 用于聚类图2 GMM 用于概率密度估计图3 GMM 用于背景建模我们以 GMM 聚类为例子进行讨论。如图 1 所示，假设我们有 m 个点，其坐标数据为 { , … }。假设 m 个数据分别属于 k 个类别，且不知道每个点属于哪一个类。倘若假设每个类的分布函数都是高斯分布，那我们该如何求得每个点所属的类别?以及每个类别的概率分布函数(概率密度估计)？我们先尝试最大似然估计。上式中是当前 m 个数据出现的概率，我们要将它最大化；是出现的概率；是指第z 个类；u 和分别指第z 个类的均值和方差；为其他的参数。为计算方便，对上式两边取对数，得到似然函数。 1 EM 算法与GMM 2014 上说道，GMM 的表达式为k 个高斯分布的叠加，所以有为类出现的先验概率。令j= ,所以此时的似然函数可以写为上式中 x 和 z 为自变量；为需要估计的参数。为高斯分布，我们可以写出解析式，但是的形式是未知的。所以如果我们不能直接对求偏导取极值。考虑到z 是不能直接观测到的，我们称为隐藏变量(latent variable)。为了求解我们引入 EM 算法(Expectation-Maximization)。我们从Jensen 不等式开始讨论EM 算法。 Jensen 不等式若实函数存在二阶导且有，则为凸函数(convex function)。的值域为，则对于有以下不等式成立：此不等式的几何解释如下 2 EM 算法与GMM 2014 需要说明的是，若则不等式的方向取反。对上式进行推广，便可得到Jensen 不等式(Jensen’s Inequality)。倘若有为凸函数，且则有此结果可由数学归纳法得到，在这里不做详细的描述。值得注意的是，如果Jensen 不等式中的，而且把看做概率密度，则有上式成立的依据是，，为概率密度时，f(E(x))= 且。在后续的 EM 算法推导中，会连续多次应用到Jensen 不等式的性质。 EM算法现在重新考虑之前的似然函数直接对上式进行最大化求解会比较困难，所以我们考虑进行一定的变通。假设是某种概率密度函数,有且。现在对的表达式进行一定得处理，先乘以一个再除以一个，有 3 EM 算法与GMM 2014 我们把看做是的函数; 为概率密度，则有考虑到log 函数为凹函数，利用Jensen 不等式有此时我们找到了的一个下界。而且这个下界的选取随着的不同而不同。即我们得到了一组下界。用下图来简