- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中国科学院大学计算机与控制学院硕士课 《模式识别》
第3章:参数估计(续)
刘成林(liucl@nlpr.ia.ac.cn)
2015年10月14 日
助教:杨学行(xhyang@nlpr.ia.ac.cn)
吴一超(yichao.wu@nlpr.ia.ac.cn)
上次课主要内容回顾
• 离散变量贝叶斯决策
• 复合模式分类
• 最大似然参数估计
• 贝叶斯估计 高斯分布的情况
Parameter space vs
feature space 二者的区别和联系
2
提 纲
• 第3章
– 特征维数问题
– 期望最大法
– 隐马尔可夫模型
3
特征维数问题
• 统计模式分类
– 特征空间划分
– 贝叶斯决策:最小风险规则,MAP
• 增加特征有什么好处
– 判别性:类别间有差异的特征有助于分类
• 带来什么问题
– 计算
– 存储
– 泛化性能,Overfitting
4
分类错误率与特征的关系
• 二类高斯分布
– p(x |ω )~N(μ ,Σ),j =1,2, 等协方差矩阵
j j
– Bayes error rate
– Conditionally independent case
• 每一维二类均值之间距离反映区分度,决定错误率
2
• 特征增加有助于减小错误率(r 增大)
5
• 特征维数决定可分性的例子
– 3D空间完全可分
– 2D和1D投影空间有重叠
然而,增加特征也可能导致分类性能更差,因为有模型
估计误差(wrong model)
6
计算复杂度
• 最大似然估计
– 高斯分布,d维特征,n个样本
– 参数估计的复杂度,主要由Σ决定
• 参数存储复杂度
c(d d (d 1) / 2)
• 分类复杂度?
7
过拟合(Overfitting)
• Overfitting
– 特征维数高、训练样本少导致模型参数估计不准确
2
• 比如协方差矩阵需要样本数在d 以上
• 克服办法
– 特征降维:特征提取(变换) 、特征选择
– 参数共享/平滑
• 共享协方差矩阵Σ0
• Shrinkage (a.k.a. Regularized Dis
您可能关注的文档
最近下载
- 食品经营(仅销售预包装食品)备案申请表-模板.pdf VIP
- 宁夏枣泉电厂一期工程的环境影响的报告书简本.doc VIP
- 2022年国家公务员录用考试行测常识题库及答案(共1344题).pdf VIP
- (人教PEP2024版)英语三年级上册全册大单元教学设计(新教材).docx
- 北京交通大学DSP系统课程设计报告电话拨号音检测.docx VIP
- 妇产科规培年度述职报告.docx VIP
- 【庄歌】黄沙坪矿区生产实习.doc VIP
- 2025届高考英语二轮复习:非谓语动词课件 (共49张PPT).ppt.pptx VIP
- 一种驱虫斑鸠菊提取物的外用制剂及其制备方法.pdf VIP
- 杭州优迈SMART系统中文标示电气原理图.pdf VIP
文档评论(0)