- 1、本文档共60页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
切空间距离具有任意变换不变性
集合之间的距离度量 Hausdorff距离 练习计算集合 与 之间的Hausdorff距离 切空间距离 很多实际问题中,任意选择距离度量(如最常用的欧几里德距离)会带来糟糕的结果 切空间距离 不变量(invariance)问题 平移 旋转 尺度变换 线条粗细 …… 解决方案 预处理 使用更加一般化(具有**不变性)的距离度量 切空间距离 切空间距离具有任意变换不变性 假设问题可能会涉及r种变换 对每一个训练样本x’进行所有可能的变换,表示为 ,i=1,2,…,r,其中 为第i个变换的参数,如平移距离,旋转角度等 对每一种变换,可以构造一个切向量(tangent vector): 所有变换的切向量张成x’的一个切空间(tangent space),该切空间是对x’可能发生的所有变换的一个线性逼近,其中每个点对应一种可能的变换 测试点x到x’的切空间距离即x到x’的切空间的最小距离,因此可认为具有任意变换不变性 切空间距离 例:旋转与细化的切空间 切空间距离 求x到x’的切空间距离 切空间距离 基于切空间距离的最近邻分类器通常具有很高的准确率 但是,切空间距离的计算要求设计者预先知道所有可能的变换,并且能够在每个原型点(训练样本点)上应用这些变换,这一要求在实践中有时无法满足 切空间距离的计算复杂度较高,在数据量较大时计算量可能无法忍受 小结 kn-近邻估计 小结 最近邻规则 直接估计后验概率 误差率 误差界 如果xk属于类别 ,则判断x的类别为 小结 k-近邻规则 误差界 降低k-近邻计算复杂度的方法 计算部分距离 预建立结构 对训练样本加以剪辑 如果 是在S中出现频率最高的类,则判断x的类别为 小结 距离度量的性质 非负性 自反性 对称性 三角不等式 常用距离度量 欧几里德距离 Minkowski距离 Mahalanobis距离 小结 集合之间的距离度量 Tanimoto距离 Hausdorff距离 切空间距离 任意变换不变性 * 黑板作图 尖锐的变化源自体积V的突然变化 * 把一维空间切分成若干小区间,数一数每个区间中有多少样本,落入某个区间中的个数k除以总数就是其对应格子的概率 * * * * 平方和的最小值当所有值相等时发生 板书推导 * * * * * 黑板画图说明L_1和L_2的区别 黑板作图 最近邻规则 k=1时的k-近邻决策 把x判断为与其距离最近的训练样本x’所属的类别 给定训练集 ,其中包括n个来自c个不同类别的样本 对测试样本x,如果 是距离x最近(根据某种距离度量)的训练样本,则最近邻(1-NN)规则为 最近邻规则是次优的方法,通常的误差率比最小可能的误差率(即贝叶斯误差率)要大 如果xk属于类别 ,则判断x的类别为 最近邻规则 直观理解 当样本个数非常大时,可认为x’距离x足够近,以使得即最近邻规则是对真实后验概率的一个有效近似 Voronoi网格 最近邻规则把特征空间分成一个个网格单元结构,称为Voronoi网格 每一个单元包含一个训练样本点x’ 该单元中任意一点x,到x’的距离均小于到其他训练样本点的距离 该单元中所有样本点均判别为x’所属的类别 最近邻规则的误差率 给定训练集 ,其中包括n个来自c个不同类别的样本 对测试样本x,设 是距离x最近的训练样本 x和xk的类别标记分别为 和 条件误差概率 最近邻规则的误差率 条件误差概率(cont’) 当 时,假设D包含的样本足够多,使得则当 时,有 平均误差率( 时) 最近邻规则的误差界 平均误差率 的下界 平均误差率 的上界 当 对每个x取最小值时, 最大 设x的真实类别为 ,则贝叶斯误差率表示为 最近邻规则的误差界 平均误差率 的上界(cont’) 给定 (即给定 )此式当第二项最小时最小,而第二项当 对所有除m以外的i取值相同时最小,即 最近邻规则的误差界 平均误差率 的上界(cont’) 所以或 所以 当P*较小时,最近邻规则的平均误差率上界: 最近邻规则的误差界 k-近邻规则 k-近邻(k-NN)规则是对最近邻(1-NN)规则的扩展,即考虑多个最近的邻居 给定训练集 ,其中包括n个来自c个不同类别的样本 对测
您可能关注的文档
最近下载
- 二审有新的证据上诉状(标准版).docx VIP
- 国家开放大学《化工仪表及自动化》形考任务1 (综合卷)参考答案 .pdf
- 尼科尔森微观经济学第11版笔记和课后习题答案.pdf VIP
- 水文预报课程设计报告资料.doc
- 《医学图像分割介绍》课件.pptx VIP
- 精品解析:2023-2024学年山东省青岛市李沧区青岛版六年级上册科学考试科学试卷(原卷版).docx VIP
- 医学图像分割介绍说明课件.pptx VIP
- SWITCH塞尔达传说旷野之息1.6金手指127项修改使用说明教程.docx
- 总经理年终总结与新年展望.docx
- 2024届高考模拟作文“有备与无备”导写+标题+范文5篇.docx
文档评论(0)