- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
关于算法及其推广第1页,共26页,星期日,2025年,2月5日EM算法是一种迭代算法,1977年由Dempster等人总结提出,用于含有隐变量的概率模型参数的极大似然估计,或极大后验概率估计。EM算法的每次迭代由两步组成:E步,求期望;M步,求极大。所以这一算法称为期望极大算法(ExpectationMaximization),简称EM算法。第2页,共26页,星期日,2025年,2月5日极大似然估计极大似然估计是概率论在统计学中的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次实验,观察其结果,利用结果推出参数的大概值。第3页,共26页,星期日,2025年,2月5日极大似然估计似然函数:已知样本集X,X是通过概率密度p(x|θ)抽取。样本集X中各个样本的联合概率:为了便于分析,由于L(θ)是连乘的,还可以定义对数似然函数,将其变成连加的:第4页,共26页,星期日,2025年,2月5日极大似然估计求极值可以转换为以下方程:θ的极大似然估计量表示为:第5页,共26页,星期日,2025年,2月5日9.1EM算法的引入9.1.1 EM算法9.1.2 EM算法的导出9.1.3 EM算法在非监督学习中的应用9.2EM算法的收敛性第6页,共26页,星期日,2025年,2月5日9.1.1EM算法例9.1(三硬币模型)假设有3枚硬币,分别记作A,B,C.这些硬币正面出现的概率分别是π,p,q.进行如下掷硬币试验:先掷硬币A,根据其结果选出硬币B或硬币C,正面选硬币B,反面选硬币C;然后掷选出的硬币,掷硬币的结果,出现正面记作1,出现反面记作0;独立地重复n次试验(这里,n=10),观测结果如下:1,1,0,1,0,0,1,0,1,1假设只能观测到掷硬币的结果,不能观测掷硬币的过程。问如何估计三硬币正面出现的概率,即三硬币模型的参数。第7页,共26页,星期日,2025年,2月5日解三硬币模型可以写作y:观测变量,表示一次试验观测的结果是1或0z:隐变量,表示未观测到的掷硬币A的结果θ:θ=(π,p,q)是模型参数第8页,共26页,星期日,2025年,2月5日将观测数据表示为Y=(Y1,Y2,…,Yn)T,未观测数据表示为Z=(Z1,Z2,…,Zn)T,则观测数据的似然函数为 即考虑求模型参数θ=(π,p,q)的极大似然估计,即第9页,共26页,星期日,2025年,2月5日EM算法首先选取参数的初值,记作,然后通过下面的步骤迭代计算参数的估计值,直至收敛为止。第i次迭代参数的估计值为。EM算法的第i+1次迭代如下E步:计算在模型参数下观测数据yj来自掷硬币B的概率 那么观测数据yj来自硬币C的概率为1-μ(i+1)第10页,共26页,星期日,2025年,2月5日M步:先写出期望然后分别求导,计算模型参数的新估计值第11页,共26页,星期日,2025年,2月5日假设模型参数的初值取为由E步公式对yj=1与yj=0均有μj(1)=0.5利用M步迭代公式,得到继续计算μj(2)=0.5,j=1,2,…,10继续迭代,得于是得到模型参数θ的极大似然估计: EM算法与初值的选择有关,选择不同的初值可能得到不同的参数估计值。如果取初值 那么得到的模型参数的极大似然估计是第12页,共26页,星期日,2025年,2月5日算法9.1(EM算法)输入:观测变量数据Y,隐变量数据Z,联合概率分布P(Y,Z|θ),条件概率分布P(Z,Y|θ);输出:模型参数θ.(1)选择参数的初值,开始迭代,参数的初值可以任意选择,但需注意EM算法对初值是敏感的;(2)E步:记为第i次迭代参数θ的估计值,在第i+1次迭代得E步,计算这里,是在给定观测数据Y和当前的参数估计下隐变量数据Z的条件概率分布.注意,的第一个变元表示要极大化的参数,第2个变元表示参数的当前估计值.每次迭代实际在求Q函数及其极大;第13页,共26页,星期日,2025年,2月5日(3)M步:求使极大化的θ,确定i+1次迭代得参数的估计值(4)重复第(2)步和第(3)步,直到收敛,这里给出停止迭代得条件,一般是对较小的
您可能关注的文档
最近下载
- 张思德革命英雄人物故事PPT课件(图文演讲).pptx
- 多媒体技术与应用教程(全套课件91P).pptx VIP
- 肖维青中国文化英语综合教程.pdf VIP
- Unit 1 School things(大单元教学解读)三年级英语下册(译林版三起2024).pdf
- 五年级美术下册课件-5景物的近大远小(7)-冀美版.ppt
- 消防员的体能训练与技战术训练课件.pptx VIP
- 2024《财务共享服务中心的运营现状及优化策略研究-以鞍钢集团为例》14000字.docx
- 2024-2025学年九年级语文期末模拟考试卷期末模拟卷(安徽专用,范围:上册+下册).pdf VIP
- 1金正日の料理人.pdf
- 新《特种设备生产和充装单位许可规则》--气瓶充装许可部分.doc
文档评论(0)