- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Chp9:参数推断 本节课内容:计算似然的极大值 牛顿法 EM算法 极大似然估计 似然函数:令 为IID,其pdf为 ,似然函数定义为 log似然函数: 极大似然估计(MLE):使得 最大的 ,即 极大似然估计 计算MLE,需要求似然函数的极值 解析法(如本章已讲过的例子) 数值计算:通过迭代 牛顿法:简单 EM算法 迭代需要初始值,矩方法得到的结果是一个较好的初始值的选择 牛顿法 亦称牛顿-拉夫逊( Newton-Raphson )方法 牛顿在17世纪提出的一种近似求解方程的方法 使用函数 的泰勒级数的前面几项来寻找方程 的根 在MLE计算中,求 的根 对应处似然函数 取极值 牛顿法 将log似然函数的导数 在 处进行Taylor展开: 从而得到 因此迭代机制为: 牛顿法 当参数 包含多个参数为向量时,迭代机制为: 其中 为log似然函数 一阶偏导数(向量), 为二阶偏导数矩阵, EM算法(Expectation Maximization) EM: Expectation Maximization 特别适合:“缺失数据”(missing data)问题中对参数用MLE求解 由于观测过程的限制或问题引起的数据缺失(如聚类问题) 直接对观测数据,似然函数极值解析不可求;但若假设缺失数据(隐含变量)的值已知,则似然函数形式很简单 EM算法(Expectation Maximization) EM: Expectation Maximization E—步:求期望(Expectation ) 在给定观测数据的条件下,计算完整似然的期望(随机变量为隐含变量) 涉及计算缺失数据的条件期望,需要利用参数的当前估计值 M —步:求极大值( Maximization ) 求使得完整似然的期望最大的参数 又是一个极大值求解问题。通常可以解析求解,这时EM是一个很方便的工具;否则,需借助一个可靠的最大化方法求解 混合模型(Mixed Model) 混合模型: 其中 ,满足 即混合模型由K个成分组成,每个成分 的权重为 如一个班级每个学生的身高为 , 假设男生身高和女生分别服从高斯分布 、 则 其中p为男生的比例 混合模型的参数估计是EM算法最典型的应用 混合高斯模型(Mixture of Gaussians Model,GMM) 若混合模型中每个成分为高斯分布, 则称为混合高斯模型 假设每个数据点根据如下规则产生: 随机选择一个成分,选择第k个成分的概率为 从第k个成分产生数据: 即 混合高斯模型 问题:给定IID数据 ,求参数 MLE不能解析求得,因此我们通过数值计算(如EM算法)求解。 将非完整数据 转换为完整数据 ,其中 为 所属的类别。 观测数据和缺失数据 观测数据:观测到随机变量X的IID样本: 缺失数据:未观测到的隐含变量Y的值: 在GMM中,若 来自第k个分成,则 完整数据:包含观测到的随机变量X和未观测到的随机变量Y的数据, 似然函数 给定观测数据 ,非完整数据的似然函数为: 涉及求和的log运算,计算困难 完整似然函数 若隐含变量的值 也已知,得到完整数据的似然函数为: 明显简化 EM—Expectation 由于Y是未知的,计算完整似然函数对Y求期望 去掉完整似然函数中的变量Y 定义 根据贝叶斯公式:Y的分布为 EM—Maximization 对E步计算得到的完整似然函数的期望 求极大值(Maximization),得到参数新的估计值,即 每次参数更新会增大似然(非完整似然)值 反复迭代后,会收敛到似然的局部极大值 EM的收敛性(1) EM的收敛性(2) 所以相邻两次似然之差为 EM的收敛性(3) 所以 其中 为KL散度。 所以: 如果Q增大,则观测数据的似然增大 在M步,Q肯定增大 当Q
您可能关注的文档
- 2015年高考现代文阅读复习.ppt
- 20世纪中国社会三次巨变三位伟人、三大理论成果.ppt
- 2、领先世界的古代手工业.ppt
- 3.3 关于有限群表示的基本定理3.3.1 幺正化定理.ppt
- 3.4 三角函数的积化和差与和差化积 一、素质教育目标(一).ppt
- 3.4 与水相关的食品学问题及相关技术原理3.4.1 水分活度与食.ppt
- 3.7.1 床层的流态化过程 三个阶段:固定床、流化床、颗粒输.ppt
- 30秒沟通路径.ppt
- 3、3 信息的智能化加工.ppt
- 4 天然免疫应答和炎症.ppt
- 2024年湖南省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年江西省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年安徽省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年福建省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年广东省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年河北省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年河南省高考英语试卷(含答案解析)+听力音频.docx
- 2024年湖北省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年湖南省高考英语试卷(含答案解析)+听力音频+听力原文.docx
- 2024年江苏省高考英语试卷(含答案解析)+听力音频+听力原文.docx
本人在医药行业摸爬滚打10年,做过实验室QC,仪器公司售后技术支持工程师,擅长解答实验室仪器问题,现为一家制药企业仪器管理。
文档评论(0)