统计模式识别方法.docx

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计模式识别方法 在嗅觉模拟技术领域中,模式识别问题就是由气敏传感器阵列的测量 空间向被测对象的的分类或分级空间转化的问题。由于这种模式空间的变 化对识别或鉴别结果有着较大的影响,因此模式识别算法的研究和讨论始 终较为活跃,各种模式识别方法层出不穷,有力推动了嗅觉模拟技术的应 用进程。下面介绍几种常用的统计模式识别方法。 统计模式识别概述 统计方法,是发展较早也比较成熟的一种方法。被识别对象首先数字化,变换为适于计算机处理的数字信息。一个模式常常要用很大的信息量来表示。许多模式识别系统在数字化环节之后还进行预处理,用于除去混入的干扰信息并减少某些变形和失真。随后是进行特征抽取,即从数字化后或预处理后的输入模式中抽取一组特征。所谓特征是选定的一种度量,它对于一般的变形和失真保持不变或几乎不变,并且只含尽可能少的冗余信息。特征抽取过程将输入模式从对象空间映射到特征空间。这时,模式可用特征空间中的一个点或一个特征矢量表示。这种映射不仅压缩了信息量,而且易于分类。在决策理论方法中,特征抽取占有重要的地位,但尚无通用的理论指导,只能通过分析具体识别对象决定选取何种特征。特征抽取后可进行分类,即从特征空间再映射到决策空间。为此而引入鉴别函数,由特征矢量计算出相应于各类别的鉴别函数值,通过鉴别函数值的比较实行分类。 统计模式识别的技术理论较完善,方法也很多,通常较为有效,现已形成了一个完整的体系。尽管方法很多,但从根本上讲,都是利用各类的分布特征,即直接利用各类的概率密度函数、后验概率等,或隐含地利用上述概念进行识别。其中基本的技术为聚类分析法、判别类域代数界面法、 统计决策法、最邻近法等。 在聚类分析中,利用待分类模式之间的“相似性”进行分类,较相似的作为一类,较不相似的作为另外一类。在分类过 程中不断地计算所划分的各类的中心,一个待分类模式与各类中心的距离作为对其分类的依据。这实际上在某些设定下隐含地利用了概率分布概念,因常见的概率密度函数中,距期望值较近的点概密值较大。该类方法的另一种技术是根据待分类模式和已指判出类别的模式的距离来确定其判别,这实际上也是在一定程度上利用了有关的概念。判别类域界面法中,用已知类别的训练样本产生判别函数,这相当于学习或训练。根据待分类模式 代入判 函数后所得 的正 来确定其 。判 函数提供了相 两 判 域的界面,其也相 于在一些 定下两 概密函数之差。在 判决中,在一些分 准 下 格地按照概率 理 出各种判决 , 些判决 可以 生某种意 上的最 分 果。 些判决 要用到各 的概率密度函数、先 概率或后 概率。 可以通 本 未知概率密度函数中的参数 行估 ,或 未知的概密函数等 行逼近而估 他 。 在最 近法中,是根据待分 模式的一个或 k 个近 本的 而 确定其 。 主成分分析方法 主成分分析是一种掌握事物主要矛盾的 分析方法,也是一种古老的多元 分析技 。它可以从多元事物中解析出主要影响因素,揭示事 物的本 , 化复 的 。 算主成分的目的是将高 数据投影到 低 空 。 定 n 个 量的 m 个 察 ,形成一个 n x m 的数据矩 , n 通常比 大。 于一个由多个 量描述的复 事物,人 以 ,那么是否可以抓住事物主要方面 行重点分析呢?如果事物的主要方面 好体 在几个主要 量上,我 只需要将 几个 量分离出来, 行 分析。但是,在一般情况下,并不能直接找出 的关 量。 我 可以用 原有 量的 性 合来表示事物的主要方面 , PCA 就是 一种分析方法。 PCA 的目 是 找 r( rn ) 个新 量,使它 反映事物的主要特征, 原有数据矩 的 模。每个新 量是原有 量的 性 合,体 原有 量的 合效果,具有一定的 含 。  r 个新 量称 “主成分”,它 可以在很大程度上反映原来  n 个 量的影响,并且 些新 量是互不相关 的,也是正交的。通 主成分分析, 数据空 ,将多元数据的特征在 低 空 里直 地表示出来。例如,将多个 点、多个 条件下的基 因表达 数据( N )表示 3 空 中的一个点,即将数据的 数从 RN 降到  R3  。 PCA  的算法步 相关矩  Rp×p,求特征方程  R  i  0 ,其解 特征根 λi  将解由小 到大 行排序 :  1  2  L  p  0 求 本数据矩 X 的 方差矩 。 2. 求 方差矩 的特征 ,并按降序排列, 如 12Lp0 3. 求 于各特征 的 位特征向量u1, , u2 ? , 并作相 的主 。 4.按下式计算某个特征值的贡献率:i i 100% p j j 1 根据各特征值贡献率的大小,依次选取所

文档评论(0)

137****0220 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档