- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 概率密度函数的估计 3.1 引言 3.2 参数估计的基本概念 3.3 最大似然估计与正态分布的参数估计 3.4 Bayes估计与正态分布参数的估计 3.5 总体分布的非参数估计 3.6 分类器错误率的估计问题 3.1 引言 在贝叶斯决策理论中,基本的已知条件是: 类先验概率 P(ωi) 类条件概率密度 p(x |ωi ) 疑问: 它们从何而来? 分类器的设计分成两步来完成: 1 利用样本集估计出P(ωi) 、 p(x |ωi )(本章要解决的基本问题) 2 利用Bayes决策理论设计分类器(前一章已经解决的问题) 本章要解决的三个问题 如何用样本集估计出P(ωi) 、 p(x |ωi )的估计量 评估与分析估计量的性质 利用样本集估计分类器错误率的方法 从样本集推断总体概率分布的方法 说明: 监督:样本的类别是已知的 非监督:样本的类别是未知的 参数估计:概率密度形式已知,只需推断出其中的未知参数 非参数估计:直接推断出概率密度本身 监督参数估计 条件:已知样本所属的类别及类条件总体概率密度函数的形式,未知概率密度函数的某些参数 监督参数估计:从已知类别的样本集,推断(估计)出总体分布(每一类概率密度函数)的某些参数的方法 例如:从样本求正态分布的均值向量与协方差矩阵 非监督参数估计 条件:未知样本所属类别,已知总体概率密度函数形式,但未知其中的某些参数 非监督参数估计:推断(估计)出总体概率密度函数中的某些参数的方法 非参数估计 条件:已知样本所属类别,但未知总体概率密度函数的形式 非参数估计:从已知类别的样本数据中,直接推断出概率密度函数本身 本章讲解的重点内容: 1 监督参数估计(估计类条件概率密度的参数) 2 非参数估计(估计类条件概率密度本身) 3 分类器错误率的实验估计方法 3.2 参数估计的基本概念 1 统计量 2 参数空间 3 点估计、估计量(估计子)、估计值 4 区间估计 1 统计量 目的:样本中包含着总体的信息,希望有一种数学手段将样本集中的有关信息抽取出来 统计量:针对不同要求构造出的关于样本的某种函数,这种函数在统计学中称为统计量 2 参数空间 在参数估计中,已知总体概率密度函数的形式,未知分布中的若干参数(记为 θ ) 在统计学中,将总体分布未知参数 θ 的全部可容许值组成的集合称为参数空间,记为 Θ (例如,n 维实数空间) 3 点估计 点估计问题是利用样本数据估计出总体分布参数的值 估计量(估计子):构造一个统计量d(x1,…,xN) 作为参数 θ 的估计 ,在统计学中称 为 θ 的估计量(估计子) 估计量的性能评估 估计量是随机变量,不同的样本有不同的估计值 无偏估计量:估计量的期望等于真实参数 3.3.1 最大似然估计的基本理论 在统计学中似然函数的定义 最大似然估计的主要思想:如果在一次观察中一个事件出现了,则我们可以认为这一事件出现的可能性很大。现在,事件(x1,…xN )在一次观察(从概率总体中抽取一组样本)中居然出现了,则我们认为似然函数 l(θ) 应该达到最大值 便于分析,可以取似然函数的对数,即 求最大似然估计量的方法 如果H(θ) 满足一定数学性质(连续可微),可以直接应用高等数学的知识来求最大点,即求梯度(偏导数),令其等于零,解线性或者非线性方程组得到估计量 说明: 3.3.2 正态分布参数的最大似然估计值 解释: 正态总体均值的最大似然估计量是学习样本的算术平均 正态总体方差的最大似然估计量是 N 个矩阵 的算术平均 模式识别系统的基本构造 对数函数是单调增函数,H(θ) 与 l(θ) 的最大点相同 设 梯度算子 从中求解出 θ 的最大似然估计量 1 有可能存在多个解 最大似然估计示意图 2 有可能求不出正确的解(比如均匀分布) 均匀分布 N = 100 没有极大值点 对数似然函数 两者至少有一个为无穷大,显然不合理 最小的可能值 最大 单变量正态分布的概率密度函数 要求的未知参数(均值与方差) 我们已知 N 个一维样本集 问题:利用最大似然估计法,针对上述样本集,求出均值与方差的估计值 最大似然估计量满足的方程 均值 方差 对于多元正态分布的概率密度函数 均值向量 协方差矩阵 性质: 均值的估计是无偏的 协方差矩阵的估计是渐近无偏的 无偏估计 3.3.3 用身高、体重区分男女生的例子 到现在为止,我们知道: Bayes决策理论 概率密度参数的最大似然估计 下面讲一个简单的应用 我们的任务可能是: 大学生男女同学在身高、体重方面的差别? 大学生男女同学在身高、体重方面是否存在明显的界限? 用同学们的身高、体重来区分男女同学? 解决的方案:已讲的分类方法来处理 数据获取 预处理 特征提取与
您可能关注的文档
- 云计算与软件公共服务应用.doc
- 云计算与中小企业管理.ppt
- 云里雾里.doc
- ppt艺术设计2.1-黎加厚.ppt
- 云渲染.doc
- UG简介及应用实例.doc
- 在mysql数据库中传入中文字符,并实现正常显示.doc
- VD1500云终端网络计算机(教育版).ppt
- 在SQL Server数据库管理系统上,实现用户对数据库的远程管理.doc
- 造价工程计算内容.doc
- 小学科学:ESP8266智能插座电路原理与动手实践研究教学研究课题报告.docx
- 《金融开放浪潮下我国多层次监管体系构建与创新研究》教学研究课题报告.docx
- 区域教育质量监测中人工智能应用的数据质量分析与优化策略教学研究课题报告.docx
- 《金融科技监管中的数据治理与合规性要求》教学研究课题报告.docx
- 《3D打印技术在航空航天领域中的多材料制造与复合材料应用》教学研究课题报告.docx
- 《绿色金融发展中的政府职能与市场机制研究》教学研究课题报告.docx
- 《植物工厂多层立体栽培光环境调控技术对植物生长发育节律的调控机制探讨》教学研究课题报告.docx
- 销售团队年度业绩总结.docx
- 银行风险管理与金融危机防范.docx
- 银行网络攻击预警与快速响应机制.docx
最近下载
- 2022医院医疗机构开展违反中央八项规定精神突出问题专项治理的实施方案(详细版).pdf VIP
- 半导体工艺炉的炉门及半导体工艺炉.pdf VIP
- 测绘行业安全生产汇报.pptx VIP
- 半导体后端工艺半导体封装的作用、工艺和演变.docx VIP
- 半导体工艺原理--半导体工艺原理(贵州大学).ppt VIP
- 麦肯锡中国银行业CEO季刊(2020年秋)-麦肯锡-224页正式版.pdf VIP
- 走进潮汕文化ppt课件(优质ppt).pptx
- DG_TJ 08-2439-2024 建筑工程“多测合一”技术标准(正式版).pdf VIP
- Camera客观标准测试.pdf VIP
- 2024年湖北省恩施州恩施市六角亭街道招聘社区工作者真题参考答案详解.docx VIP
文档评论(0)