统计的模式识别概论及的应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计的模式识别概论及的应用

统计的模式识别概论及的应用   【摘 要】本文采用统计模式识别方法对车辆进行识别,利用主成分变换法对车辆和背景训练及测试样本进行特征提取,并应用遗传算法对特征提取阶段的结果进行特征选择,然后对测试样本做同样的提取特征的处理,最后应用训练好的支持向量机分类器进行分类识别检测。此基于统计特征的车辆识别算法不仅具有较好的适应性,而且能有效的提高识别率和降低误识别率。   【关键词】模式识别;特征提取;遗传算法;支持向量机   0 引言   模式识别诞生于20世纪20年代,是对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。该学科主要研究使机器通过学习能做以前只能由人类才能做的事,具备人所具有的、对各种事物与现象进行分析、描述与判断的部分能力。模式识别所研究的理论和方法在很多科学和技术领域中得到了广泛的重视,目前已成功应用于指纹识别、印刷体字符识别、语音识别、车牌识别、人脸识别、手写体字符识别、自动文本分类、多媒体数据挖掘等领域。   本文基于统计模式识别方法来研究车辆识别问题。对待定的区域应用特征提取、特征选择的方法提取统计特征,根据统计模式识别原理对候选车辆区域行识别确认。特征提取采用PCA(主成分变换法),特征选择采用遗传算法,分类器设计是SVM(支持向量机)。   1 统计模式识别方法   基于统计方法的模式识别系统由四部分组成:数据获取、预处理、特征提取和选择、分类器设计和分类决策。   1.1 数据获取与预处理   数据获取就是通过一定的技术和手段对个别事物进行观测,从而获取该事物的时间和空间分布信息。这里需要将各种测量的量转换成计算机可以直接处理的数据。测量到的信号通常有一维信号,二维信号和逻辑信号。预处理阶段就是要将数据获取阶段所引入的噪声进行滤除,并对数据获取阶段所造成的信号退化进行复原,并为下一步特征提取提供必要的基础。   1.2 特征提取与特征选择   通常情况下,在数据获取阶段获得的数据量是相当大的。直接应用这些数据进行模式识别,数据量大,计算复杂。当向量维数达到一定维数时,就必须采取一定的措施能使系统能够处理这些数据和正常工作,即特征降维,模式识别中称为特征提取和选择。一般来说,特征提取和选择是模式识别系统中关键的一步,其好坏直接决定了模式识别系统的性能。   1.2.1 主成分变换法   主成分分析方法是应用最广泛的一种特征提取方法之一,它是一种统计学方法,在信号处理、模式识别、数字图像处理等领域得到了广泛的应用。主成分分析基本思想是提取出空间原始数据中的主要特征,减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的信息,从而解决数据空间维数过高的瓶颈问题。   所谓主成分就是原始数据的m个变量经线性组合后得到的变量,该变化使得其变换后的变量方差为最大(第一主成分)的部分。各个主成分之间是相互线性无关的(正交的)从第一主成分往后,主成分按方差大小的顺序排列。   1.2.2 遗传算法   遗传算法是建立在自然选择和遗传变异基础上的自适应概率性搜索算法,在该算法中,染色体是二进制字符串编码,每一编码字符串为一候选解,这种染色体有多个,即有一群候选解。染色体像生物进化一样有繁殖、交叉和突变三种现象,这些现象称为遗传算子。在每一代中,保持一定数目M为定值的解群,经过对各解的适应度值计算,使解群中的各个解得到评价,各个解的适应度值的大小作为染色体复制机会大小的先决条件。   遗传算法中有一个很重要的概念,称为适应度函数。如何将遗传算法中的不断进化的染色体与现实问题中的优劣选择相联系是该算法成功的关键。一般的方法是构造一个与现实问题相联系的适应度函数。   1.3 分类器   从数学观点来看,分类决策就是找出决策函数。当已知待识别模式的完整的先验知识时,可据此确定决策函数的数学表达式。如果仅知待识别模式的定性知识,则在确定决策函数的过程中,通过反复训练、调整,以达满意的决策函数表达式,从而作为决策分类的依据。   支持向量机是一种基于统计的学习方法,它是对结构化风险最小化归纳原则的近似,由于其出色的学习性能,使得SVM具有较好的推广能力。其原理是针对二值分类问题提出的,其核心思想是将结构风险函数引入到分类中。支持向量机通过引入结构风险函数恰恰能完成这个任务,从而提高了机器学习的泛化能力。这些特点使支持向量机能有效地克服高维问题。   2 实例分析   为了检验各个主成分变换特征提取方法和支持向量机分类器对车辆检测的识别率和有效性,我们进行了对比实验:特征提取和特征选择的方法与不同分类器方法进行组合测试。   为了检验本论文中提出的车辆检测方法,我们进行了实验测试。道路取景的来源国内城市道路。实验中

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档