- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1; 特征选择和提取; 特征选择和提取; 特征选择和提取; 特征选择和提取; 特征选择和提取; 特征选择和提取;7.1 模式类别可分性的测度;7.1 模式类别可分性的测度;类别可分离性判据:衡量不同特征及其组合对分类是否有效的定量准则
理想准则:某组特征使分类器错误概率最小
实际的类别可分离性判据应满足的条件:
度量特性:
与错误率有单调关系
当特征独立时有可加性:
单调性:
常见类别可分离性判据:基于距离、概率分布、熵函数;类间可分性:=所有样本间的平均距离:;基于距离的准则概念直???,计算方便,但与错误率没有直接联系;7.2 特征选择;特征选择:=从原始特征中挑选出一些最有代表性、分类性能最好的特征进行分类。
从D个特征中选取d个,共CdD种组合。若不限定特征选择个数,则共2D种组合- 典型的组合优化问题
特征选择的方法大体可分两大类:
Filter方法:根据独立于分类器的指标J来评价所选择的特征子集S,然后在所有可能的特征子集中搜索出使得J最大的特征子集作为最优特征子集。不考虑所使用的学习算法。
Wrapper方法:将特征选择和分类器结合在一起,在学习过程中表现优异的的特征子集会被选中。;经典特征选择算法;单独最优特征组合;顺序前进法;顺序后退法;遗传算法;遗传算法;6.5 讨论;7.2 特征选择;7.2 特征选择;7.2 特征选择;7.2 特征选择;作业;7.3 离散K-L变换;6.3 特征提取与K-L变换;K-L变换;离散K-L变换的均方误差;求解最小均方误差正交基;求解最小均方误差正交基;K-L变换的表示;K-L变换的性质;K-L变换的性质;K-L变换的数据压缩图解;K-L变换的产生矩阵;未知类别样本的K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;7.3 离散K-L变换;作业
文档评论(0)