- 1、本文档共49页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章 特征的选择与提取
第1章 绪论 第6章 特征选择和特征提取 6.1 类别可分离性判据 6.2 特征提取 6.3 特征的选择 以前我们假定给出了维数为n的确定的模式样本集,代表模式的特征是选择好的。但在实际设计一个模式识别系统时,首先要解决的问题用各种可能的手段对识别对象的性质作各种可能的测量,并将这些测量值作为分类的特征。而为了设计出好的分类器,一般需要对原始的测量值集合进行分析,进行选择或变换,组成识别特征,在保证一定分类精度的前提下,减少特征维数,使分类器的工作又快又准确。要达到上述目的,关键是所提供的模式特征应具有很好的可分性(类别可分离性判据来衡量),同时去掉那些关联性较强的特征。下面我们看一下本章中设计到的基本概念。 特征形成 根据被识别的对象产生出来的一组基本特征。 特征提取 在原始特征的维数很高的情况下,通过映射(或变换)的方法用低维空间来表示样本,这个过程叫特征提取。 特征选择 从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,称为特征选择。 6.1 类别可分离性判据 6.2 特征提取 6.3 特征选择 THANK YOU VERY MUCH ! 本章到此结束 下一章“基于K—L变换 的特征提取” 返回本章首页 习题讲解(P81) 习题3-1 解:极大似然估计 返回本章首页 Bayes估计 返回本章首页 习题讲解(P81) 习题3-4 求Bayes估计量 解:由样本集 求出样本联合分布 返回本章首页 的后验分布 Bayes估计量 返回本章首页 返回本章首页 返回本章首页 设在 D 个可用作分类的特征中,为在不降低分类精度的前提下,从中直接选出 d 个作为分类特征。解决两个问题 (1)选择的标准; (2)选择的算法; 选择的标准(分两种情况进行讨论 ) (1)对于独立特征的选择准则—基于距离的可分性判据 (2)一般特征的选择准则 1 离散度矩阵判据 2 散度和变换散度判据 选择的算法 分支定界搜索法 返回本章首页 对于独立特征的选择准则—基于距离的可分性判据 类别可分性判据的一般性质: 对于基于距离的可分性判据来说 ,不同模式特征的均值向量之间的距离应最大,而属于同一类的模式特征,其方差和应最小。定义可分性判别函数 返回本章首页 ——均值向量 在 k 维方向的分量 ——在 k 维方向的方差 按大小排列,选出开头最大的d个 作为特征向量,就达到了特征选择的目的。 上述的判据虽然简单,但其使用范围与模式特征的概率分布有关,几种特殊的情况。 返回本章首页 返回本章首页 一般特征的选择准则 由于特征分量之间的相关性,各分量单独判别并不能获得最优的选择结果。这时可采用类内类间的离散度矩阵、散度等可分性判据。 (1)离散度矩阵判据 类内: 类间: 总体: 离散度矩阵可分离性判据: 返回本章首页 (2)散度和变换散度 对于类概率密度为正态分布的两类问题,散度为 使 最大的子集,就是最适于分离 和 两类模式的特征。推广到 c 类,可以计算平均散度 选出平均散度为最大的子集作为 c 类的分类特征,是合理,但不是最优的。同时,若其中有一种类对的散度很大,就使平均散度显著偏离,因而掩盖了对散度小的那些类对的判别,这里引入变换散度来改善这种情况。 第6章 特征选择和特征提取 返回本章首页 返回本章首页 返回本章首页 返回本章首页 我们可以依据某种准则进行特征提取和选择,为此,应当首先构造这样的准则——类别可分离性判据。这些判据应能反映各类在特征空间中的分布情况,应能刻画各特征分量在分类识别中的重要性或贡献。 1 类别可分离性判据满足的要求 (1)与错误概率(或其的上下界)有单调关系; (2)当特征独立时有可加性 返回本章首页 (3)具有“距离”的某些特性,即 (4)对特征数目是单调不减,即加入新的特征后,判据值不减。 这里指出,所构造的可分离性判据并不一定同时具有上述的四个性质,但这并不影响它在实际使用中的性质。 下面对几种常用的判据进行讨论。 返回本章首页 2 用于可分离性判据的类内类间距离 我们说,各类样本可以分开是因为它们位于特征空间中的不同的区域,显然这些区域之间的距离越大类别可分离性就越大。 两个类区 和 之间的平均距离 多类情况下,各类之间的平均距离 返回本章首页 定义第 i 类样本集的均值向量 所有各类的样本集总平均向量 各类之间的平均距离
您可能关注的文档
- 第5章中央银行与货币政策.ppt
- 第5章螺纹结合的互换性.ppt
- 第5节 块、图库及系统查询.ppt
- 第5章纳米膜过滤技术.ppt
- 第5节 表示元素的符号(第一课时).ppt
- 第5节 表示元素的符号(第1课时).ppt
- 第5章5水晶.ppt
- 第5章第2节金属矿物 铁的冶炼课件.ppt
- 第5节_电磁感应规律的应用.ppt
- 第5讲决策.ppt
- 纺织服装_化妆品_医美行业2022年年度投资策略_50页_4mb.pptx
- 【工信部】2024建筑和卫生陶瓷行业节能诊断服务指南.pptx
- 【中国建筑节能协会】中国城市绿色低碳建材应用现状评估报告_59页_1mb.pptx
- 【荣续ESG智库】2024建筑行业ESG白皮书_51页_22mb.pptx
- 牛津经济研究院-二手服装对非洲和欧盟27国的社会经济影响+(英)-2024.10-156页_3mb.pptx
- 【印度服装出口促进委员会_AEPC_】2025年春夏全球时尚趋势报告_92页_21mb.pptx
- 纺织服装行业2022年度策略:竞争加剧,个股分化,产品为王-20211110-国盛证券-54页_2mb.pptx
- 20191219-天风证券-纺织服装行业投资策略:野百合也有春天,纺服也有核心资产_64页_3mb.pptx
- 【深圳市住房和建设局】深圳市住房和建设局:深圳市公共建筑能耗监测情况报告(2023年度)_65页_2mb.pptx
- 2022北京市建筑低碳高质量发展的路径和行动报告-北京市可持续发展促进会_66页_2mb.pptx
文档评论(0)