L01-模式识别-绪论.pptVIP

下载本文档

0
0
约3.17千字
约 49页
2018-02-11 发布于江西
举报
版权申诉

L01-模式识别-绪论.ppt

1、本文档共49页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

L01-模式识别-绪论

模式识别第一章模式识别绪论 “To understand is to perceive patterns” -Isaiah Berlin 什么是模式？模式是混沌的反面模式是对事物模糊的定义什么是识别将模式划分为某一类别。分类（已知类别）聚类（创建新类别）什么是模式识别对表征事物的各种形式的（数字的、文字的和逻辑关系的）信息进行处理和分析，对事物和现象进行描述、辨认、分类和解释的过程。信息科学和人工智能的重要组成部分。人类思考的能力基于识别模式。计算机能够更好的识别模式，它就更想人类。我们是如何进行识别的观察环境和分析问题学习从背景中分辨感兴趣的模式对于模式的类别做出合理的判决。模式识别的应用（1）字符识别输入输出：Earham encourage 模式识别的应用（2）语音识别输入：声波信号输出：语音内容模式识别应用（3）指纹识别输入：指纹图像输出：身份模式识别应用（４）签名验证输入：签名点序列输出：签名人身份模式识别应用（５）人脸检测输入：图像输出：人脸在图像中的位置模式识别应用（６）文档分类输入：ＨＴＭＬ文件输出：文档类别模式识别应用（７）财务预测输入：股票价格时间序列输出：牛？熊？其他应用目前已知最好的模式识别系统模式识别的基本概念模型（Model）可用数字形式表达的不同特征的描述样本（Sample）模式的实例，分类的基本对象。训练集（Training Set）用于训练分类器的样本的集合。测试集（Test Set）用于测试分类器的样本集合，通常应与训练及无交集基本概念特征（Feature）可用于样本分类的属性。特征向量（Feature Vector）由一组特征组成的向量，通常为列向量。特征空间（Feature Space）由所有可能的特征组成的空间。散布图（Scatterplot）将每个特征表示为特征空间中的一个点基本概念决策（判决）面（曲线）特征空间中用于区分各类别的界限例子——鲑鱼？鲈鱼？预处理调整光照去除噪声增强对比度 …… 分割将鱼从背景中分离出来特征提取从鱼的图像中提取用于分类的特征分类根据分类准则做出判断——鲑鱼？鲈鱼？选择用于分类的特征选择用于分类的特征决策边界与代价使用两个特征：光泽度x1和宽度x2 样本的特征向量：[x1,x2] 泛化能力泛化能力/推广能力（Generalization）设计分类器的最终目标是能够对新样本做出正确的分类，而不是对训练样本完美分类。分类模型对训练样本的过分匹配是应该努力避免的现象：过配（Overfitting）避免过配的方法避免过于复杂的决策面左右为难复杂的决策面？简单的决策面？模式识别系统模式识别系统的设计方法模式识别中的重要问题噪声分割数据采集领域知识特征抽取模式表示缺失特征模型选择过配上下文分类器集成代价与风险计算复杂度 ……. 噪声（Noise）不同类型的噪声（如：阴影、图像的抖动的等）噪声导致提取特征的可靠性降低。噪声处理方面可有助于减少噪声的影响，提高性能。分割（Segmentation）单个的模式必须被分割出来如何在没有分类的情况下进行分割？如何在没有分割的情况下进行分类？数据采集（Data Collection）我们怎么知道已经采集了足够的样本用于识别系统的训练和测试？数据采集的成本可能相当的高。领域知识（Domain Knowledge）当没有足够的训练数据时，结合领域知识有助于提高性能模式生成的模型模式生成的方法特征提取（Feature Extraction）领域相关的知识影响分类器的性能那些特征最重要？是否存在一种方法可以自动地学习那些特征最重要？我们应该使用多少特征？选择对噪声鲁棒的特征选择能够获得简单判决边界的特征模式表示相似的模式应该有相似的表示不同类型的模式应该有不同的表示模式表示对与变换应该保持不变，如：平移、旋转、缩放、反转、非刚性形变类内方差要小、类间方差要大缺失特征（Missing Features）某些特征可能不可见（如：由于遮挡）当有缺失特征时，如何获得最好的分类结果？当有缺失特征时，如何训练分类器？模型选择（Model Selection）我们怎么知道什么时候应该放弃一类模型而尝试其他模型模型的选择过程仅仅是反复实验吗？如何使该过程自动化？过配（Overfitting）越复杂的模型，越容易导致过配。（即，对训练数据性能好，对新数据性能差）如何调整模型的复杂度？理论上是否存在找到最佳复杂度