模式识别 第一章 绪论.ppt

  1. 1、本文档共64页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
理论基础:形式语言,自动机技术 主要方法:自动机技术、CYK剖析算法、Early算法、转移图法 主要优点: 1)识别方便,可以从简单的基元开始,由简至繁。 2)能反映模式的结构特征,能描述模式的性质。 3)对图象畸变的抗干扰能力较强。 主要缺点: 当存在干扰及噪声时,抽取特征基元困难,且易失误。 理论基础:模糊数学 主要方法:模糊统计法、二元对比排序法、推理法、模糊集运算规则、模糊矩阵 主要优点: 由于隶属度函数作为样本与模板间相似程度的度量,故往往能反映整体的与主体的特征,从而允许样本有相当程度的干扰与畸变。 主要缺点: 准确合理的隶属度函数往往难以建立,故限制了它的应用。 理论基础:神经生理学,心理学 主要方法:BP模型、HOP模型、高阶网 主要优点: 可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题。允许样本有较大的缺损、畸变。 主要缺点: 模型在不断丰富与完善中,目前能识别的模式类还不够多。 理论基础:演绎逻辑,布尔代数 主要方法:产生式推理、语义网推理、框架推理 主要优点: 已建立了关于知识表示及组织,目标搜索及匹配的完整体系。对需要众多规则的推理达到识别目标确认的问题,有很好的效果。 主要缺点: 当样本有缺损,背景不清晰,规则不明确甚至有歧义时,效果不好。 独立与相关 独立:两件事是独立的,如果给定第一件事,无论它的结果是什么,第二件事物的机会都一样。否则,他们是不独立的。(两次抛硬币独立吗?) 相关:如果两个变量之间存在强相关,则已知一个变量的值对预测另一个变量的值将很有帮助,但若是弱相关,关于一个变量的信息对猜测另一个变量的值无多大帮助。(有其父,必有其子) ——David Freedman 统计学 边缘分布函数: FX(x)=F(x,∞)或 FY(y)=F(∞,y) 边缘概率密度 二维情况下,就是通常指的方差 范例 木板 图象 512×512 d=3 长度 纹理 亮度 c=2 松木\ 桦木 维数 无限 有限/ 很大R 有限d 不大c 总结:模式识别过程 dR无限 模式采集 模式空间 特征提取/选择 类型空间 分类 特征空间 客观世界 待识别对象 识别过程 错误概率检测 制定分类的 判决规则 特征提取/选择方法校正 学习过程 采集方法校正 已知对象 预处理 一、信息获取   在现阶段计算机都只能处理某种形式的电信号,而待识别的样本大都是非电信息,例如癌细胞病理切片,语音信号,待识别文本,图像等,这就需要将这些以各种不同形式表现的信息通过传感器转换成电信号。如用话筒将声音信号转换成电信号,表现出电压(电流)随时间变化的复杂波形。景物信息在摄像机成像并转换成二维的象素矩阵,每个像素(矩阵元素)的电信号与物体表面反射的光强或颜色信息呈现函数关系。因此信号获取环节主要是由不同形式的传感器构成,它实现信息获取与信息在不同媒体之间的转换。 二、预处理   预处理主要是指去除所获取信息中的噪声,增强有用的信息,及一切必要的使信息纯化的处理过程。   预处理这个环节内容很广泛,与要解决的具体问题有关,例如,从图象中将汽车车牌的号码识别出来,就需要先将车牌从图像中找出来,再对车牌进行划分,将每个数字分别划分开。做到这一步以后,才能对每个数字进行识别。以上工作都应该在预处理阶段完成。 三、特征选择和提取   这个环节包含着丰富的内容,在不同场合有不同的含义。一般说来它包括将所获取的原始量测数据转换成能反映事物本质,并将其最有效分类的特征表示。这个环节的输入是原始的量测数据(经过必要的预处理),例如由声波变换 成的电信号,表现为电压电流幅度随时间的变化,二维图像每个像素所具有的灰度值等。这些数据包含着所需信息的原始形式,但它往往不适合于分类器直接使用。特征提取模块将原始量测数据转换成有效方式表示的信息,从而使分类器能根据这些信息决定样本的类别。前面说过待识别的样本及模式都是用特征进行描述的,识别与训练都是在特征空间中进行的。而原始数据是由所使用的量测仪器或传感器获取的,这些数据组成的空间叫测量空间。因此特征的选择与提取模块的功能是:对所获取的信息实现从测量空间到特征空间的转换。第四章将对此作进一步讨论。   特征选择和提取就是说选择什么样的方法来描述事物,从而可以有效、牢靠地把事物正确地区分开。我们先举一个数字识别的例子来说明特征选择的重要性。 一、信息获取   在现阶段计算机都只能处理某种形式的电信号,而待识别的样本大都是非电信息,例如癌细胞病理切片,语音信号,待识别文本,图像等,这就需要将这些以各种不同形式表现的信息通过传感器转换成电信号。如用话筒将声音信号转换成电信号,表现出电压(电流)随时间变化的复杂波形。景物信息在摄像机成像并转换成二维的象素矩阵,每个像素(矩阵元素)的电

文档评论(0)

yyh892289 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档