- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别复习资料
10 最小错误率贝叶斯决策 对两类问题 若 ,则 若 ,则 可改写为: 统计学中称l12(X)为似然比, 为似然比阈值。 若 ,则 (4-8) 例4.1 假定在细胞识别中,病变细胞的先验概率和正常细胞的 先验概率分别为 。现有一待识别细胞, 其观察值为X,从类条件概率密度发布曲线上查得: 试对细胞X进行分类。 解:[方法1] 通过后验概率计算。 [方法2]:利用先验概率和类概率密度计算。 ,是正常细胞。 最小风险贝叶斯决策基本思想: 以各种错误分类所造成的平均风险最小为规则,进行分类 决策。 11 最小风险贝叶斯决策 2)两类情况:对样本 X 当X 被判为ω1类时: 当X 被判为ω2类时: (4-15) (4-16) 由(4-15)式: 决策规则: 令: ,称似然比; ,为阈值。 ② 计算 。 ③ 计算 。 ① 定义损失函数Lij。 判别步骤: ④ 类概率密度函数 p(X |ωi) 也称ωi的似然函数 解:计算 和 得: 例4.2 在细胞识别中,病变细胞和正常细胞的先验概率 分别为 现有一待识别细胞,观察值为X, 从类概率密度分布曲线上查得 损失函数分别为L11=0,L21=10, L22=0,L12=1。按最小风险贝 叶斯决策分类。 为病变细胞。 经过选择或变换,组成识别特征,尽可能保留分类信息,在保证一定分类精度的前提下,减少特征维数,使分类器的工作即快又准确。 12 特征选择和提取的目的 13 特征选择和特征提取的异同 (1)特征选择:从L个度量值集合 中按一定准 则选出供分类用的子集,作为降维(m维,m L)的分类 特征。 (2)特征提取:使一组度量值 通过某种变换 产生新的m个特征 ,作为降维的分类特征, 其中 。 复习 14.特征提取的方法 其中, 第二步:计算C的特征值,对特征值从小到大进行排队,选择 前m个。 第四步:利用A对样本集{X}进行变换。 则m维(m n)模式向量X *就是作为分类用的模式向量。 解:1) 求样本均值向量和协方差矩阵。 由 得 由归一化特征向量u1构成变换矩阵A: 变换前 变换后 多类类内散布矩阵Sw 15 特征选择 从n个特征中选择d个(d n)最优特征构成分类用特征向量。 1).散布矩阵准则 类别可分性测度 类间散布矩阵Sb 多类总体散布矩阵St 特征选择准则 使tr(Sw)最小 使tr(Sb)最大 使J1~J4最大 复习 例:从5个特征中选出2个特征作为模式向量。 复习 1.模式和模式识别的概念 1)模式:对某些感兴趣的客体的定量的或结构的描述。模式类是具有某些共同特性的模式的集合。 2)模式识别:研究一种自动技术,依靠这种技术,计算机将自动地(或人尽量少地干涉)把待别识模式分配到各自的模式类中去。 复习 2 模式识别系统组成 学习过程 判决过程 分类规则训练 分类决策 数据获取 预处理 特征选择 或提取 模式识别系统框图 复习 1) 监督分类:需要依靠已知类别的训练样本集,按照他们特征向量的分布来确定判别函数,然后利用判别函数对未知模式进行分类。需要足够的先验知识。 判别。需要有足够的先验知识。 2) 非监督分类:用于没有先验知识的情况,通常采用聚类分析的方法。 3 监督分类和无监督分类 复习 4 模式识别整体知识结构 5 最大最小距离算法(小中取大距离算法 ) 算法描述 ① 选任意一模式样本做为第一聚类中心Z1。 ② 选择离Z1距离最远的样本作为第二聚类中心Z2。 ③ 逐个计算各模式样本与已确定的所有聚类中心之间的距离,并选出其中的最小距离。例当聚类中心数k=2时,计算 min( Di1 , Di2 ),i=1,…,N (N个最小距离) 复习 ⑥ 将样本 按最近距离划分到相应聚类中心对应 的类别中。 ⑤ 重复步骤③④,直到没
原创力文档


文档评论(0)