第六章 特征的选择与提取 P176
§6.1 基本概念
§6.2 类别可分离性判据
§6.3 按距离度量的特征提取方法
§6.4 按概率距离判据的特征提取方法
§6.5 基于熵函数的可分性判据
§6.6 基于K-L变换的特征提取
§6.7 特征提取方法小结
§6.8 特征选择
1
本章学习目的
1.了解特征空间选择在设计模式识别系统、解决模式识
别具体问题中是至关重要的。
2.了解描述量选择 ,特征组合优化的两种基本方法,一
是对原特征空间进行删选 ,另一种是通过变换改造原特征
空间。
3.掌握典型的线性变换对原特征空间优化的基本方法,
进一步深入理解模式识别处理问题的基本方法——确定准
则函数 ,并通过计算进行优化。
4.了解并掌握特征选择方法使用的一些基本问题。
2
§6.1 基本概念
分类器设计方法的研究固然重要,但如何确定合适的特征
空间是设计模式识别系统另一个十分重要、甚至更为关键
的问题。
如果所选用的特征空间能使同类物体分布具有紧致性 ,即
各类样本分布在该特征空间中彼此分割开的区域内,这就
为分类器设计成功提供良好的基础。
反之,如果不同类别的样本在该特征空间中混杂在一起,
再好的设计方法也无法提高分类器的准确性。
本章内容属于如何构造一个特征空间 ,即对要识别的事物
用什么方法进行描述 、分析。
3
(1) 物理量的获取与转换
物理量的获取与转换,指用什么样的传感器获取电信号。
如摄取景物则要用摄像机;
文字与数字识别,首先要用扫描仪等设备,手写体文字所
用传感器与印刷体文字可能不同。
这些都属于物理量的获取,并且已转换成电信号,为计算
机分析打下了基础
对从传感器中得到的信号,可以称之为原始信息 ,因为它
要经过加工、处理才能得到对模式分类更加有用的信号。
4
(2) 描述事物方法的选择与设计
在得到了原始信息之后,要对它进一步加工,
以获取对分类最有效的信息。这部分信息必须
对原始信息进行加工,而设计所要信息的形式
是十分关键的。
例如对阿拉伯数字的识别可以提出各种不同的
想法,有的提出分析从框架的左边框到数字之
间的距离变化反映了不同数字的不同形状,这
可以用来作为数字分类的依据。
又有的方案则是强调分析不同截面的信号,如
在框架的若干部位沿不同方向截取截面分析从
背景到字,以及从字到背景转换的情况,如AB
截面切割字符三次,CD截面切割字符一次等。
5
(3) 特征空间的优化
这个层次的工作发生在已有了特征的描述方法之后,也
就是已有了一个初始的特征空间,如何对它进行改造与
优化的问题。
一般说来要对初始的特征空间进行优化是为了降维。即
初始的特征空间维数较高。能否改成一个维数较低的空
间 ,称为优化 ,优化后的特征空间应该更有利于后续的
分类计算。
所谓优化是要求既降低特征的维数,又能提高分类器的
性能 。
两种基本方法:
特征选择 (删掉部分特征)
特征的组合优化 (一种映射),也就是说新的每一个特征
是原有特征的一个函数。 6
补充材料——广义线性判别函数
二次函数的一般形式: g
您可能关注的文档
最近下载
- PGMV机车用调速器使用指导手册.pdf
- 用爱架起一座班主任与学生沟通的桥梁.doc VIP
- 个人呼吸防护系统-CleanAIR.PDF VIP
- 中国药品检验标准操作规范(2019年版).pdf VIP
- 2026 IHC 3 希望杯3年级培训题学生版+答案版.pdf
- 北京市海绵城市雨水控制与利用工程施工及验收标准.docx VIP
- 2020年北京大学全国中学生模拟联合国大会学术标准手册.pdf VIP
- 《船舶管理(轮机长)》课件——任务1 船舶油料管理.pptx VIP
- 《船舶管理(轮机长)》课件——任务2 船舶备件管理.pptx VIP
- 《船舶管理(轮机长)》课件——项目四 船舶机械管理.pptx VIP
原创力文档

文档评论(0)