- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类模型 特征表示 (作业第四周讲)- 3.30
分类模型 特征表示 Classification model features said 主讲人:juan 日期:2015 年 3 月 30 日 《计算机视觉》--周平 * * #4 查准率和查全率 特征表示 目 录 #1 #2 #3 模式识别 分类模型 * * * * 一、模式识别 定义1:将一个目标实例以一个目标原型或类别定义进行匹配的过程成为验证。(e:银行自动柜员机) 模式识别是根据输入的原始数据对其进行各种分析判断,从而得到其类别属性,特征判断的过程。 模式是存在于时间和空间中的可观察的事物,如果我们可以区别它们是否相同或者是否相似,那我们从这种事物所获取的信息就可以称之为模式。 人们为了掌握客观的事物,往往会按照事物的相似程度组成类别,而模式识别的作用和目的就在于把某一个具体的事物正确的归入某一个类别。 识别的一个定义是再认识。 “人以类聚,物以群分” 用计算机实现人对各种事物或现象的分析、描述、判断、识别。 * * 用例子说明,哪些是模式识别的范畴: 1.将铅笔、钢笔、圆珠笔、毛笔、彩笔都归类为书写用的“笔”; 2.医生根据心电图化验单来判断病人是否得心脏病; 3.警察根据指纹来进行身份验证; 4.利用计算机进行字符识别; 5.根据用户的虹膜进行身份识别;(虹膜与指纹一样独一无二) 6.判断当前用户发出的声音是什么字符; 7.判断当前图片中是否有行人、人脸、车辆等; 8.对出现在图片序列中的行人、车辆进行跟踪; 9.对图片中的人脸进行身份识别验证; 10.对车辆的拍照进行识别; 11.判断车辆的颜色、车型; 12.在海量图片库当中寻找与某一张图片相似的若干图片; 13.根据用户哼唱的音调搜索对应的歌曲...... 二、分类模型 * * 一个理想类别是一些具有重要工头属性的目标的集合在实际中,某目标所属类别用类别标号来标识。分类就是根据目标的属性表示赋予目标类别号的过程。分类器是一种设备或算法,她输入的是目标的表示,输出的是类别标号。 拒绝类别是无法归入任何已知类别的目标设置的通用类别。 特征空间:从模式得到的对分类有用的度量、属性或基元构成的空间。 解释空间:将 C 个类别表示为 ,其中 为所属类别的集合,称为解释空间。 二、分类模型 分类任务的输入数据是记录的集合。每条记录也称实例或者样例,用元组(x, y)表示,其中x是属性的集合,而y是一个特殊的属性,指出样例的类标号(也成为分类属性或目标属性)。 * * 分类(classification 通过学习得到一个目标函数(target function) , 也成为分类模型(classification model),把每个属性集x映射到一个预先定义的类标号y。 目的: 1、描述性建模 分类模型可以作为解释性的工具,用于区分不同类中的对象。 2、预测性建模 分类模型还可以用于预测未知记录的类标号。 * * 分类 分类器的任务:根据输入属性集x确定类标号y。 分类技术非常适合预测或描述二元或标称类型的数据集,对序数分类不太有效,因为分类技术不考虑隐含在目标类中的序关系。 * * 输入属性集(x) 分类模型 输出类标号(y) 解决分类问题的一般方法 分类技术是一种根据输入数据集建立分类模型的系统方法。 * * 分类技术 这些技术都使用一种学习算法确定分类模型,修改这个模型能够很好地拟合输入数据中类标号和属性集之间的联系。学习算法得到的模型不仅要很好地拟合输入数据,还要能够正确地预测未知样本的类标号。 训练算法的目标:建立具有很好的泛化能力的模型。 表中每个表项 表示实际类标号为 i 但是被预测为类 j 的记录数。被分类模型正确预测的样本总数是 ,而被错误预测的样本总数是 。 * * 二类问题的混淆矩阵 * * 二类问题的混淆矩阵 同样,分类模型的性能也可以用错误率(error rate)来表示,其定义如下: 目标:寻求最高的准确率或者最低的错误率 虽然混淆矩阵提供衡量分类模型的信息,但是用一个数汇总这些信息更便于比较不同模型的性能。为实现这一目的,可以使用性能度量(performance metric),如准确率(accuracy),其定义如下: * * 三、查准率查全率 定义1:文档检测系统的查准率,是检索出的相关文档数(属于C1类)与检索出的文档总数(属于C1类的文档数加上实际是C2类的误报文档数)之比。 定义2:文档检索系统的查全率,是检索出的相关文档数与数据
您可能关注的文档
- 《如何建设班集体》课件.ppt
- 《变速器习题》课件.ppt
- 《前言-走进地理学》(周俊雄)课件.ppt
- 《党委会的工作方法》解析课件.ppt
- 《抗震设计计算题》课件.pptx
- 《染色体畸变-2》课件.ppt
- 《环保节能》课件.ppt
- 《电气安全第1章》课件.ppt
- 《护理管理学第3章计划》课件.ppt
- 《看图猜成语(二)》课件.ppt
- 2025AACR十大热门靶点推荐和解读报告52页.docx
- 财务部管理报表.xlsx
- 高中物理新人教版选修3-1课件第二章恒定电流第7节闭合电路欧姆定律.ppt
- 第三单元知识梳理(课件)-三年级语文下册单元复习(部编版).pptx
- 俄罗斯知识点训练课件-七年级地理下学期人教版(2024).pptx
- 课外古诗词诵读龟虽寿-八年级语文上学期课内课件(统编版).pptx
- 高三语文二轮复习课件第七部分实用类文本阅读7.2.1.ppt
- 高考物理人教版一轮复习课件第4章第3讲圆周运动.ppt
- 高考英语一轮复习课件53Lifeinthefuture.ppt
- 2025-2030衣柜行业风险投资发展分析及投资融资策略研究报告.docx
文档评论(0)