- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别 第六章近邻法 回顾 最简单的分段线性分类器:把各类划分为若干子类,以子类中心作为类别代表点,考查新样本到各代表点的距离并将它分到最近的代表点所代表的类。 极端情况,将所有样本都作为代表点---- 近邻法 §6.1 最近邻法 §6.1 最近邻法 最小距离分类器:将各类训练样本划分成若干子类,并在每个子类中确定代表点,一般用子类的质心或邻近质心的某一样本为代表点。测试样本的类别则以其与这些代表点距离最近作决策。该法的缺点是所选择的代表点并不一定能很好地代表各类,其后果将使错误率增加。 最近邻法的基本思想:以全部训练样本作为“代表点”,计算测试样本与这些“代表点”,即所有样本的距离,并以最近邻者的类别作为决策。 近邻法是由Cover和Hart于1968年提出的,随后得到理论上深入的分析与研究,是非参数法中最重要的方法之一。 §6.1 最近邻法 将与测试样本最近邻样本的类别作为决策的方法称为最近邻法。 6.1 最近邻法 §6.1 最近邻法 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 有以下两种例外情况△P=0: P(ω1|X)=1 P(ω1|X)=P(ω2|X)=1/2。 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率 最近邻法的错误率高于贝叶斯错误率,可以证明以下关系式成立: 小结 6.2 k-近邻法 6.2 k-近邻法 K近邻法的错误率 对于两类问题, 有以下两种例外情况△P=0: PN(e|x,x’)=P(ω1|x) P(ω2|x’) + P(ω2|x) P(ω1|x’) 当N-∞时, P(ωi|x’) 近似等于P(ωi|x) PN- ∞(e|x,x’)=P(ω1|x) P(ω2|x) + P(ω2|x) P(ω1|x) 对于K近邻法 K近邻法的错误率 对所有的x,有: PN- ∞(e|x) ≤Ck[P*(e|x)] 根据Jensen不等式, P=E[PNk(e|x) ≤ E{Ck[P*(e|x)]} ≤ CkE{ [P*(e|x)]} = Ck( P*) 不等式关系 P* ≤P ≤ Ck( P*) ≤ Ck-1( P*) ≤… ≤ C1( P*) ≤2 P* (1- P* ) k-近邻法的错误率 最近邻法和k-近邻法的错误率上下界都是在一倍到两倍贝叶斯决策方法的错误率范围内。 在k →∞的条件下,k-近邻法的错误率要低于最近邻法。 在k →∞的条件下,k-近邻法的错误率等于贝叶斯误差率。 例题: 设在一个二维空间,A类有三个训练样本,图中用红点表示,B类四个样本,图中用蓝点表示。试问:(1)按近邻法分类,这两类最多有多少个分界面(2)画出实际用到的分界面 解答: 按最近邻法,对任意两个由不同类别的训练样本构成的样本对,如果它们有可能成为测试样本的近邻,则它们构成一组最小距离分类器,它们之间的中垂面就是分界面,因此由三个A类与四个B类训练样本可能构成的分界面最大数量为3×4=12。实际分界面如下图所示,由9条线段构成。 §6.3 改进的近邻法 §6.3 改进的近邻法-快速搜索近邻法 快速搜索近邻法 (1)样本集的分级分解 首先将整个样本分成l个子集,每个子集又分为它的l个子集,如此进行若干次就能建立起一个样本集的树形结构。分成子集的原则是该子集内的样本尽可能聚成堆,这可用聚类方法实现。 结点参数: 树形结构,每个结点表示一样本子集,描述该子集的参数是: 快速搜索近邻法 快速搜索近邻法 (2)快速搜索算法 要实现快速搜索近邻,需要有方法快速判断某个样本子集是否是该待识样本的可能近邻样本集,从而可将无关的样本子集尽快排除。另一方面在某样本子集内寻找哪个样本是近邻时,需快速排除不可能为近邻的样本。 这两个快速判别算法可用以下两个规则表示。 快速搜索近邻法 快速搜索近邻法 快速搜索近邻法 (3)搜索算法 搜索算法的大体过程是这样的: 当搜索树形样本集结构由高层次向低层次深入时,对同一层次的所有结点,可以利用规则1排除掉一些不可能包含待识别样本的近邻的结点(样本子集)。但是这往往不能做到只留下唯一的待搜索结点,因此必须选择其中某一结点先深入搜索,以类似于深度优先的方法确定搜索路径直至叶结点。然而在该叶结点中找到的近邻并不能保证确实是全样本集中的最近邻者,所找到的该近邻样本需要在那些有可能包含最近邻的样本子集中核对与修正,直至找到真正的最近邻样本为止。
您可能关注的文档
最近下载
- GB∕T22281-2024《网络安全技术——信息安全控制》之23:“5组织控制-5.23云服务使用的信息安全”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
- [第五章资本结构决策.ppt VIP
- T-PE002303C-气液分离器计算及选型导则.pdf VIP
- GB∕T22281-2024《网络安全技术——信息安全控制》之24:“5组织控制-5.24 信息安全事件管理规划和准备”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
- 2023年上海东滩建设集团有限公司招聘考试真题.docx VIP
- GB∕T22081-2024《网络安全技术——信息安全控制》之25:“5组织控制-5.25信息安全事态的评估和决策”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
- GB∕T22081-2024《网络安全技术——信息安全控制》之28:“5组织控制-5.28证据收集”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
- 《GB_T 44565-2024高效能炉排炉评价技术要求》专题研究报告.pptx
- GB∕T22081-2024《网络安全技术——信息安全控制》之26:“5组织控制-5.26信息安全事件的响应”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
- GB∕T22081-2024《网络安全技术——信息安全控制》之27:“5组织控制-5.27从信息安全事件中学习”专业深度解读和应用指导材料(雷泽佳编制-2025A0).pdf VIP
原创力文档


文档评论(0)