- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精选文库
EM 算法原理与应用
一、最大似然
假 我 需要 我 学校的男生和女生的身高分布。那么多人不可能一个一个去
吧,肯定是抽 。假 在校园里随便地活捉了
100 个男生和
100 个女生。他 共
200 个人
(也就是 200
个身高的 本数据, 了方便表示,下面,我
“人 ”的意思就是 的身
高)都在教室里面了。开始喊:
“男的左 ,女的右 ,其他的站中 !
”。然后先 抽
得到的 100
个男生的身高。假 他 的身高是服从高斯分布的。但是 个分布的均
μ
2
2
T
和方差 σ我 不知道, 两个参数就是我 要估 的。 作
θ=[ μ,σ]
。
用数学的 言来 就是:在学校那么多男生(身高)中,我 独立地按照概率密度
p(x|θ)抽取 100
了个(身高), 成 本集
X,我 想通 本集
X 来估 出未知参数 θ。
里概率密度
p( x|θ)我 知道了是高斯分布
2
2 T
。
N(μ,σ)的形式,其中的未知参数是
θ=[ μ,σ]
抽到的 本集是
X={ x1,x2, ?,xN} ,其中 xi 表示抽到的第
i 个人的身高, 里
N 就是 100,表
示抽到的 本个数。
由于每个 本都是独立地从
p(x|θ)中抽取的, 句
100 个男生中的任何一个,都
是我随便捉的,从我的角度来看 些男生之 是没有关系的。那么,我从学校那么多男生
中 什么就恰好抽到了
100
个人呢?抽到
100 个人的概率是多少呢?因 些男生
(的身高)是服从同一个高斯分布
p(x|θ)的。那么我抽到男生
A (的身高)的概率是
p(xA|θ),抽到男生
B 的概率是
p(xB|θ),那因 他 是独立的,所以很明 ,我同 抽到男
生 A 和男生 B 的概率是 p(xA
B
|θ),同理,我同 抽到
100 个男生的概率就是他 各
|θ)* p(x
自概率的乘 了。用数学家的口吻 就是从分布是
p(x|θ)的 体 本中抽取到
100 个 本
的概率,也就是 本集
X 中各个 本的 合概率,用下式表示:
L( )
L( x1 , x2 ,..., xn ;
)
n
p xi ;
,
1
i
个概率反映了,在概率密度函数的参数是
θ ,得到 X 本的概率。因 里
X
是已知的,也就是 我抽取到的
100 个人的身高可以 出来,也就是已知的了。而
θ是
未知了, 上面 个公式只有
θ是未知数,所以它是
θ的函数。 个函数放映的是在不同
的参数 θ取 下,取得当前 个 本集的可能性,因此称 参数
θ相 于 本集
X 的似然
函数( likehood function )。 L(θ)。在学校那么男生中,我一抽就抽到
100 个男生
(表示身高),而不是其他人,那是不是表示在整个学校中,
100 个人(的身高)出
的概率最大。那么 个概率怎么表示?哦,就是上面那个似然函数
L(θ)。所以,我 就只
需要找到一个参数
θ,其 的似然函数
L(θ)最大,也就是 抽到
100 个男生(的身
高)概率最大。 个叫做
θ的最大似然估 量, :
?
arg max l
。有 ,可以看
到 L(θ)是 乘的,所以 了便于分析, 可以定 数似然函数,将其 成 加的:
n
n
H ( ) ln L
ln
p xi ;
ln p xi ;
i 1
i 1
要求 θ,只需要使 θ的似然函数
L(θ)极大化,然后极大 的
θ就是我 的估 。
里就回到了求最 的 了。怎么求一个函数的最 ?当然是求 ,然后 数
0,那
么解 个方程得到的
θ就是了(当然,前提是函数
L(θ) 可微)。那如果
θ是包含多个
参数的向量那怎么 理啊?当然是求
L(θ) 所有参数的偏 数,也就是梯度了,那么
n 个
未知的参数,就有
n 个方程,方程 的解就是似然函数的极 点了,当然就得到
n 个参
数了。
最大似然估 可以把它看作是一个反推。多数情况下我 是根据已知条件来推算 果,而最大似然估 是已 知道了 果,然后 求使 果出 的可能性最大的条件,以此作
估 。极大似然估 ,只是一种概率 在 学的 用,它是参数估 的方法之一。 的是已知某个随机 本 足某种概率分布,但是其中具体的参数不清楚,参数估 就是通 若干次 , 察其 果,利用 果推出参数的大概 。最大似然估 是建立在
--
精选文库
的思想上:已知某个参数能使 个 本出 的概率最大,我 当然不会再去 其他小概率的 本,所以干脆就把 个参数作 估 的真 。
求最大似然函数估 的一般步 :
1)写出似然函数;
2) 似然函数取 数,并整理;
3)求 数,令 数 0,得到似然方程;
4)解似然方程,得到的参
您可能关注的文档
- 4升5数学测习题.docx
- 50t污泥板框脱水实施总结方案.docx
- 5、6、7的分以及合总结练习.docx
- 6T实务现场管理学习达标标准手册.docx
- 6以及7的加减法教案反思.docx
- 789的分成学习总结复习计划练试题10以内加减应用题.docx
- 7、太阳以及生活.docx
- ABB变频器800参数设置以及故障处理.docx
- AHeroinMyHeart英语作文范例.docx
- BIM考试技术概论习题库题集有答案.docx
- 2024年广西北海市海城区高德街道办事处招聘1人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广西南宁市经开区金凯街道事业单位招聘8人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广西来宾市兴宾区人民医院引进紧缺急需人才8人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广东能源集团(云浮)蓄能发电限公司社会公开招聘9名公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广州荔湾区龙津街招考出租屋管理员公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广西崇左市天等县残疾人联合会招聘1人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广东省江门市蓬江区区直机关事业单位合同制行政辅助人员招考129人公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广西柳州柳城县事业单位自主招聘工作人员66人公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广西柳州市城中区委员会区直属机关工作委员会招聘1人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
- 2024年广东省珠海市香洲区区直机关事业单位招聘劳务派遣行政辅助/专业技术人员33人历年公开引进高层次人才和急需紧缺人才笔试参考题库(共500题)答案详解版.docx
文档评论(0)