模式识别清华-课件第三章.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概述本章介绍了一种非参数判别分类方法——机器学习方法——其原理特点和优势,以及在实际应用中的应用场景强调了机器学习过程中的数据驱动性和灵活性,并结合实例阐述了线性分类器和支持向量机两种常见的机器学习模型主要内容1非参数判别分类器的原理它是一种在无监督学习中用于区分新实例与已有样本的简单预测方法与传统的朴素贝叶斯决策相比,机器学习的方法通常更适用于大规模数据集使用贝叶斯决策理论来构建分类器和预测边界,使得模型能够处理未知和复杂的数据

非参数判别分类方法

学习指南

学习这一章最主要的是了解它在模式识别技术中所处的地位。前一章重点学习的贝叶斯决策具有理论指导的意义,同时也指明了根据统计参数分类决策的方向。沿这条路走就要设法获取样本统计分布的资料,要知道先验概率,类分布概率密度函数等。然而在样本数缺乏条件下要获取准确的统计分别也是困难的。这样一来人们考虑走另一条道路,即根据训练样本集提供的信息,直接进行分类器设计。这种方法绕过统计分布状况的分析,绕过参数估计这一环,而企图对特征空间实行划分,称为非参数判别分类法,即不依赖统计参数的分类法。这是当前模式识别中主要使用的方法,并且涉及到人工神经元网络与统计学习理论等多方面,是本门课最核心的章节之一。

非参数判别分类方法的核心是由训练样本集提供的信息直接确定决策域的划分方法。这里最重要的概念是分类器设计用一种训练与学习的过程来实现。机器自动识别事物的能力通过训练学习过程来实现,其性能通过学习过程来提高,这是模式识别、人工神经元网络中最核心的内容。

学习这一章要进一步体会模式识别中以确定准那么函数并实现优化的计算框架。

由于决策域的分界面是用数学式子来描述的,如线性函数,或各种非线性函数等。因此确定分界面方程,这包括选择函数类型与确定最正确参数两个局部。一般说来选择函数类型是由设计者确定的,但其参数确实定那么是通过一个学习过程来实现的,是一个叠代实现优化的过程。因此本章从最简单的函数类型讲起,再扩展到非线性函数。同学们学习的重点要放在线性判别函数的根本内容上,然后再注意如何扩展到非线性函数的应用上去。

该章的学习最好通过概念的反复推敲与思考,以加深对重要概念的理解,另一方面通过实验,亲自体验设计模式识别系统的完整过程,对学习才会更加真切。

数学是模式识别中不可缺少的工具,希望大家学习时,遇到的数学方面的内容要通过再学习、复习等进一步掌握,如线性代数、矩阵的特征值分解与特征向量等概念的运用上起到很重要的作用。通过这门课学习加深对这些数学工具的理解与运用熟练程度是会终身受益的。对于数学推导理解程度的要求,会对增强同学分析问题解决问题的能力有好处。

学习目的

(1)通过本章学习掌握模式识别中最重要的非参数判别分类法的原理

(2)掌握机器自学习的原理,自学习功能已不仅在模式识别中应用,目前经常用机器学习这个词以涉及更为广泛的内容。

(3)学习线性分类器的三种典型算法,这三种算法各自形成体系,分别形成了传统模式识别、人工神经元网络以及统计学习理论

(4)用近邻法进行分类

(5)通过相应数学工具的运用进一步提高运用数学的本领

本章重点

(1)非参数判别分类器的根本原理,与参数判别分类方法的比拟

(2)线性分类器的三种典型方法——以Fisher准那么为代表的传统模式识别方法,以感知准那么函数为代表的机器自学习方法,以及支持向量机代表的统计学习理论。

(3)近邻法的工作原理及其改良

(4)线性分类器扩展到非线性分类器,两类别分类方法与多类别分类方法

本章难点

(1)Fisher准那么函数,其中用到向量点积,带约束条件的拉格朗日乘子法以及矩阵的特征值、特征向量等数学工具。要求对这些数学工具较深理解。

(2)感知器准那么函数提出利用错误提供信息实现叠代修正的学习原理

(3)支持向量机方法设计约束条件为不等式的极值优化问题

(4)三种不同典型方法的优缺点比拟

(5)近邻法的改良

知识点

课前思考题:

(1)机器能否像人类一样通过例证教育认知事物,修正观念中的错误的成分?

(2)机器学习过程中有教师吗?谁是教师?

(3)什么叫线性分类器?按照基于最小错误率贝叶斯决策,什么条件下才能用线性分类器?

§在上一章中我们讨论了贝叶斯决策理论和统计判别方法。从原理上说贝叶斯决策理论采用了在d维特征空间中样本分布的最一般描述方式,即统计分布来描述,并且采用分类器中最重要的指标——错误率作为产生判别函数和决策面的依据,因此它给出了最一般情况下适用的“最优”分类器设计方法,对各种不同的分类器设计技术在理论上都有指导意义。但是直接使用贝叶斯决策理论需要首先得到有关样本总体分布的知识,具体说来包括各类先验概率P(ω1)及类条件概率密度函数,从而可以计算出样本的后验概率P(ω1|X),并以此作为产生判别函数的必要数据,设计出相应的判别函数与决策面。

§3.2.1在线性判别函数的根本概念

3.2.2广义线性判别数

3.2.3线性分类器设计步骤

3.2.4Fisher线性判别函数3.2.4.1Fisher准那么函数

3.2.4.2最正确W值确实定

3.2.4.3判别函数确实定

3.2.5感知准那么函数(一)(二)感知准那

文档评论(0)

liuzhouzhong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档