- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]第四章 描述量选择及特征的组合优化
第四章 描述量选择及特征的组合优化
学习指南 这一章要讨论的问题与前几章有所不同。前两章主要讨论模式识别的重要概念,如贝叶斯分类器、线性分类器与非线性分类器等。在讨论这些设计分类器的方法时,提到有一个样本集,样本集中的样本用一个已经确定的向量来描述,这也就是说对要分类的样本怎样描述这个问题是已经确定的。例如对苹果与梨的划分,我们使用尺寸、重量和颜色三种度量来描述。这种度量方法是已经确定好的。在这种条件下研究用线性分类器好还是非线性分类器好,以及这些分类器的其它设计问题。
这一章要讨论的问题是对已有的特征空间进行改造,着重于研究对样本究竟用什么样的度量方法更好。譬如上面提到的对苹果与梨用三种度量来描述。那么是否运用这三种度量是最有效的呢?譬如颜色这一个指标对区分红香蕉苹果与梨很有效。因为前者是红色,后者是黄色,用这个指标上的差异很容易将红香蕉苹果与梨区分开。但是如用颜色区分黄香蕉苹果与梨恐怕就会困难得多。换句话说在这种情况下,这个指标就不很有效了。可见对分类器设计来说,使用什么样的特征描述事物,也就是说使用什么样的特征空间是个很重要的问题。这个问题称之为描述量的选择问题,意思是指保留哪些描述量,删除哪些描述量的问题。但对特征进行删选并不是唯一的方法,这种方法也不一定很有效,因此本章还要研究其它方面,由于对特征空间进行改造目的在于提高其某方面的性能,因此又称特征的优化问题。 对特征空间的改造、优化、主要的目的是降维,即把维数高的特征空间改成维数低的特征空间,降维主要有两种途径。一种是删选掉一些次要的特征,问题在于如何确定特征的重要性,以及如何删选。另一种方法是使用变换的手段,在这里主要限定在线性变换的方法上,通过变换来实现降维,这两种方法的区分要弄清楚。学习目的 1.了解特征空间的选择在设计模式识别系统,解决模式识别具体问题中是至关重要的。 2.了解描述量选择,特征组合优化的两种基本方法,一是对原特征空间进行删选,另一种是通过变换改造原特征空间。 3.典型的运用线性变换对原特征空间优化的基本方法,进一步深入理解模式识别处理问题的基本方法——确定准则函数,并通过计算进行优化。 4.使用特征选择方法的基本问题。
本章重点 1.弄清对特征空间进行优化的含义 2.对特征空间进行优化的两种基本方法——特征选择与特征的组合优化 3.对特征空间进行优化的一些常用判据 4.利用线段变换进行特征空间优化的基本方法,4.3节了解一些基本概念就可。4.6节是中的K-L变换要重点掌握。
知识点
课前思考题 1.什么叫特征空间?如果我们用颜色、尺寸、重量来衡量水果的构造的特特空间是几维空间? 2.如果用颜色、尺寸与重量组成的特征空间来区分苹果与梨,你认为这三种度量中的哪种最有效?为什么?能否想像这两种水果在这个三维空间的分布?如果用这个特征空间来区分红苹果与樱桃,你想像一下这两类水果在特征空间如何分布?能否对这两种情况设计更经济有效的特征空间? 3.如果两类物体在一个二维特征空间如图分布,能否用删除其中任一维来优化特征空间?有没有什么方法能得到一个对分类很有利的一维特征空间?
4.上题的答案可用下图Y1与Y2组成的空间表示?你认为哪个分量可以删掉?
5.你有没有办法将原在X1、X2空间表示的数改成用Y1、Y2空间表示?
§4.1 基本概念 在第二、三章所讨论的分类方法与分类器设计中,都是在d维特征空间已经确定的前提下进行的。因此讨论的分类器设计问题是一个选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题。对分类器设计方法的研究固然重要,但如何确定合适的特征空间是设计模式识别系统另一个十分重要,甚至更为关键的问题。如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。这一章要讨论的问题就是特征空间如何设计的问题。 这一章的内容属于如何构造一个特征空间,即对要识别的事物用什么方法进行描述、分析的问题。对一个具体问题来说,有以下几个不同的层次: 1.物理量的获取与转换,这是指用什么样的传感器获取电信号,如摄取景物则要用摄像机。文字与数字识别首先要用扫描仪等设备。手写体文字所用传感器与印刷体文字也很可能不同。这些都属于物理量的获取,并且已转换成电信号,为计算机分析打下了基础。对从传感器中得到的信号,可以称之为原始信息,因为它要经过加工、处理才能得到对模式分类更加有用的信号。 2.描述事物方法的选择与设计。在得到了原始信息之后,要对它进一步加工,以获取对分类最有效的信息。这部分信息必须对原始信息进行加
您可能关注的文档
- [数学]圆的面积PPT课件.ppt
- [数学]圆锥的认识ppt2.ppt
- [数学]垂直与平行.ppt
- [数学]坐标轴、一次、反比例函数.doc
- [数学]噪声测量ABC1106.ppt
- [数学]培训备课训练教程130110上传版.ppt
- [数学]大学高等数学经典课件12-8.ppt
- [数学]复变函数第三章.ppt
- [数学]复习题.doc
- [数学]如何进行课堂教学研究 孔企平.ppt
- 安徽精诚实业集团有限公司校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版及参考答.docx
- 中国六氟丙烷酯市场供需现状及前景规模预测报告2025-2031年.docx
- 安徽省粮油食品进出口集团校园招聘模拟试题附带答案详解一套.docx
- 安徽省粮油食品进出口集团校园招聘模拟试题附带答案详解及答案1套.docx
- 中国麦乳精市场竞争调查与前景动态分析报告2025-2030年.docx
- 安徽省粮油食品进出口集团校园招聘模拟试题附带答案详解完整版.docx
- 安徽省粮油食品进出口集团校园招聘85人公开引进高层次人才和急需紧缺人才笔试参考题库答案详解版参考答案.docx
- 中国煤炭智能仓储市场发展状况与投资前景规划分析报告2025-2030年.docx
- 数学教研组课程评估与反馈计划.docx
- 中国木寡糖市场需求状况及前景发展策略分析报告2025-2030年.docx
文档评论(0)