- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
条件概率密度函数最大似然估计.ppt
* 自动化科学与电气工程学院 任课教师: 刘琼 自动化学院 模式识别 条件概率密度函数的最大似然估计 Maximum Likelihood Estimation of Class-conditional Probability Density Function 教材:模式识别(第三版) 张学工编著 清华大学出版社 讲授提纲 问题提出 最大似然估计 基于最大似然估计的模式分类实例 * 讲授提纲 问题提出 贝叶斯决策论 贝叶斯公式 最大似然估计 基于最大似然估计的模式分类实例 * 问题提出(1/4) * 80条鲑鱼,20条多宝鱼 问题提出(2/4) * 第一种情况:不知晓这条鱼的任何信息,判决依据P(ωi)的大小;结论: 第二种情况: 给你这条鱼的宽度值 x,判决依据P (ωi| x); 贝叶斯决策论 鲑鱼 问题提出(3/4) 贝叶斯公式 用非正式的英语表述 * 后验概率 类条件概率密度 先验概率 根据领域知识或大量样本中计算 各类样本所占的比例得到 总体密度 所有样本关于特征x的概率密度 问题提出(4/4) * 函数形式 估计目标 估计方法 已知 函数中的未知参数 参数估计 ( 最大似然估计、贝叶斯估计 ) 未知 函数形式 非参数估计 (kn近邻估计、Parzen窗法 ) 讲授提纲 问题提出 最大似然估计 假设条件 主要思想 求解方法及解的分析 正态分布参数的最大似然估计 基于最大似然估计的模式分类实例 * 最大似然估计的假设条件 假设条件: ①类条件概率密度 p(x |ωi ) 的函数形式是已知的,但是其中的某些参数是未知的 ②待估计参数θ 是确定性的未知量 ③按类别将样本划分 c 类,第 i 样本都是从类条件概率密度 p(x |ωi ) 的总体中独立地抽取出来的 ④第 i 类的样本不包含有关 θj (i≠j)的信息。不同类别的函数在参数上相互独立,每一类样本可以独立进行处理 * 函数形式已知 参数确定但未知 样本独立同分布 类类互不干扰 设ωi类样本集有 N 个样本 它们是独立地按照概率密度 p(x | ωi ,θ ) 抽取出来的(独立同分布样本) 似然函数可以表示为: 含义:从总体中抽取 x1,…xN 这样 N 个样本的联合概率(可能性) * 最大似然估计的主要思想 最大似然估计的主要思想:如果在一次观察中一个事件出现了,则我们可以认为这一事件出现的可能性很大。现在,样本集(x1,…xN )在一次观察(从概率总体中抽取一组样本)中居然出现了,则我们认为似然函数 l(θ) 应该达到最大值 为了便于分析,可以取似然函数的对数,即 对数函数是单调增函数,H(θ) 与 l(θ) 的最大值点相同 * 求最大似然估计量的方法 如果H(θ) 满足连续可微的数学性质,可以直接应用高等数学的知识来求最大值点,即求梯度(偏导数),并令其等于零,解线性或者非线性方程组得到估计量 假设: 有s个参数 梯度算子 * 求解过程: * 从中求解出 θ 的最大似然估计量 最大似然估计结果的分析 可能存在多个解 解决方法:使得似然函数最大的解才是最大似然估计量 * 有可能求不出正确的解(比如均匀分布) * 例:正态分布函数的最大似然估计 单变量正态分布的概率密度函数 要求的未知参数(均值与方差) 已知 ,利用最大似然估计法,针对上述样本集,求出均值与方差的估计值 * * 对数似然函数 求偏导数 * 解释: 正态分布总体均值的最大似然估计量是样本属性值的算术平均(无偏) 正态分布总体方差的最大似然估计量是样本方差的算术平均(渐进无偏) 推广到多元正态分布 (无偏) 讲授提纲 问题提出 最大似然估计 基于最大似然估计的模式分类实例 * 基于最大似然估计的模式分类实例 * 已知条件: 80条鲑鱼,20条多宝鱼 对于宽度特征,两类鱼均服从正态分布 箱中这条鱼的宽度为10cm 问题:对箱中的鱼进行贝叶斯分类决策 Step1:数据准备 数据获取:对80条鲑鱼和20条多宝鱼分别测得他们的宽度值 数据预处理:剔除野值数据(如发育不正常的个例) 特征形成:每一条鱼有两个数据: 类别标识 宽度(特征) * +1 6.2 +1 5.7 …… -1 8.9 -1 9.5 ……. Step2 :类条件概率密度函数估计 * 两类样本分别满足各自的正态分布,利用最大似然估计方法分别求出鲑鱼和多宝鱼关于宽度特征的均值
文档评论(0)