- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别课件--lecture1-2
模式识别方法 模式识别系统的目标:在特征空间和解释空间之间找到一种映射关系,这种映射也称为假说。 特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。 解释空间:将c个类别表示为 其中 为所属类别的集合,称为解释空间。 假说的两种获得方法 监督学习、概念驱动或归纳假说:在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果。 依靠已知所属类别的的训练样本集,按它们特征向量的分布来确定假说 (通常为一个判别函数),只有在判别函数确定之后才能用它对未知的模式进行分类; 对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练。 假说的两种获得方法(续) 非监督学习、数据驱动或演绎假说:在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说。 在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况; 如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类; 这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果。 解决模式识别问题的几类方法 统计分类 基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法。 特征向量分布的获得是基于一个类别已知的训练样本集。 是一种监督分类的方法,分类器是概念驱动的。 结构模式识别 该方法通过考虑识别对象的各部分之间的联系来达到识别分类的目的。 识别采用结构匹配的形式,通过计算一个匹配程度值(matching score)来评估一个未知的对象或未知对象某些部分与某种典型模式的关系如何。 当成功地制定出了一组可以描述对象部分之间关系的规则后,可以应用一种特殊的结构模式识别方法 – 句法模式识别,来检查一个模式基元的序列是否遵守某种规则,即句法规则或语法。 数据聚类 目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集。 是一种非监督学习的方法,解决方案是数据驱动的。 神经网络 神经网络是受人脑组织的生理学启发而创立的。 由一系列互相联系的、相同的单元(神经元)组成。相互间的联系可以在不同的神经元之间传递增强或抑制信号。 增强或抑制是通过调整神经元相互间联系的权重系数来(weight)实现。 神经网络可以实现监督和非监督学习条件下的分类。 模式识别的应用(举例) 生物学 自动细胞学、染色体特性研究、遗传研究 天文学 天文望远镜图像分析、自动光谱学 经济学 股票交易预测、企业行为分析 医学 心电图分析、脑电图分析、医学图像分析 模式识别的应用(举例) 工程 产品缺陷检测、特征识别、语音识别、自动导航系统、污染分析 军事 航空摄像分析、雷达和声纳信号检测和分类、自动目标识别 安全 指纹识别、人脸识别、监视和报警系统 * 第1章 上页 下页 基于知识的方法(Knowledge-based) – AI、专家系统(Expert Systems) – 句法(结构)模式识别(Syntax PR or Structural PR) 基于数据的方法(Data-based) – 统计模式识别方法(Statistical PR) – 人工神经网络(ANN)、支持向量机(SVM) 混合方法(Hybrid Methods) 其他不断涌现的新方法 如何用计算机识别出橙和柠檬?? 统计计算出一批样本从顶部到最宽处的高度和水果的高度之比的平均值可作为识别特征之一。 统计模式识别的基本概念和名词约定 样本sample:待研究对象的个体,包括性质已知或未知的个体(注意:统计学中有不同的约定) 类别class:将所研究的样本性质离散化为有限的类别,认为同一类的样本在该性质上是不可区分的 – 习惯上,类别用ω 表示,如ω1、ω2 已知样本known samples:类别情况已知的样本 未知样本unknown samples:类别情况未知的样本 样本集sample set:若干样本的集合,分已知样本集和未知样本集 概念和名词约定(续) 特征features:样本的任何可区分的(且可观测的)方面 – 包括定量特征和定性特征,但通常最后转化为定量特征 特征向量feature vectors:样本的所有特征组成的n 维向量 是样本在数学上的表达,因此也称作样本 特征空间feature space:特征向量所在的n 维空间,每一个样本(特征向量)是该空间中的一个点,一个类别是该空间中的一个区域 ? 分类器classifier:能够将每个样本都分到
文档评论(0)