- 1、本文档共200页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
同K近邻估计两个一维密度:高斯和双峰分布。请注意,用有限的N个样本估计,结果是相当“高低不平” * 同K近邻估计两个一维密度:高斯和双峰分布。请注意,用有限的N个样本估计,结果是相当“高低不平” * E-c * * 划分特征空间为小的单元 边界线在两点之间的中间线处 用单元内包裹的点的类型来标示单元 如图有红黑两类 * E-c * ???? * 迪拉克delta 函数 * 用某种核函数表示某一样本对待估计的密度函数的贡献,所有样本所作贡献的线性组合视作对某点概率密度p(x)的估计 * ??? Pn * ????? * * * * * * **** * 前面我们看到的是一个单峰的经典密度分布样本估计概率密度的结果,下面我们再看看多峰的分布样本估计情况 待估的密度函数是这样的 还是使用正态窗 * ? * Additional criteria附加条件 * Additional criteria附加条件 sup是上确界,核函数φ(u)小于无穷大。 ∏连乘 * Additional criteria附加条件 sup是上确界,核函数φ(u)小于无穷大。 在u的模趋近于无穷大时,核函数φ(u)与ui的连乘等于0 * Additional criteria附加条件 sup是上确界,核函数φ(u)小于无穷大。 ∏连乘 * Additional criteria附加条件 sup是上确界,核函数φ(u)小于无穷大。 ∏连乘 * Additional criteria附加条件 sup是上确界,核函数φ(u)小于无穷大。 ∏连乘 * C-e * ??? * Query point 待判定点 * * E-c * E-c * generalize * ?In high dimensional space, randomly generated points are approximately equidistant - almost all points classified the same way??? * ??? * C-e * E-c * * (1)样本集的分级分解构建搜索树 首先将整个样本分成l个子集,每个子集又分为它的l个子集,如此进行若干次就能建立起一个样本集的树形结构。分成子集的原则是该子集内的样本尽可能聚成堆,这可用聚类方法实现。 Prestructuring Search Tree Method of nn speedup (2)用树结构表示样本分级: p: 树中的一个结点,对应一个样本子集Kp Np : Kp中的样本数 Mp : Kp中的样本均值 rp : 从Kp中任一样本到Mp的最大距离 两个快速判别规则: 1 .如果存在 ,则 中的样本都不可能是x的近邻,其中B是待识别样本X在搜索近邻过程中的当前近邻距离. 表示待识样本X到结点P的均值点 的距离。 2.如果 ,其中 ,则xi不可能是x的近邻。 Search Tree Method of nn speedup 其中rp,D(xi,Mp)在训练(建树)过程中可以先计算保存,搜索过程只需计算D(x,Mp)或更新B。 Prestructuring Algorithm (3)搜索算法 搜索算法的大体过程是这样的: 当搜索树形样本集结构由高层次向低层次深入时,对同一层次的所有结点,可以利用规则1排除掉一些不可能包含待识别样本的近邻的结点(样本子集)。但是这往往不能做到只留下唯一的待搜索结点,因此必须选择其中某一结点先深入搜索,以类似于深度优先的方法确定搜索路径直至叶结点。然而在该叶结点中找到的近邻并不能保证确实是全样本集中的最近邻者,所找到的该近邻样本需要在那些有可能包含最近邻的样本子集中核对与修正,直至找到真正的最近邻样本为止。 Search Step 置B=∞,L=0,p=0 将当前结点的所有直接后继结点放入一个目录表中,并对这些结点计算D(x,Mp) 根据规则1从目录表中去掉step2中的某些结点 如果目录表已无结点则置L=L-1,如果L=0则停止,否则转Step3。如果目录表有一个以上的结点,则转step5 在目录表中选出最近结点p’为当前执行结点。如果当前的水平L是最终水平,则转Step6,否则置L=L+1,转Step2 对当前执行结点p’中的每个xi,根据规则2决定是否计算D(x, xi)。若D(x, xi)B,则置NN=i和B= D(x, xi),处理完当前执行结点中的每个xi后转
您可能关注的文档
- 矛盾普遍性与特殊性及其辩证关系.ppt
- 矛盾是事物发展的源泉和动力111.ppt
- 煤矿安全质量标准化标准(信息调度部分)李澎.ppt
- 煤矿供电系统.doc
- 煤矿管理人员培训试题.ppt
- 煤矿机电运输安全七条规定贯彻活动意见.ppt
- 煤矿机械新技术.ppt
- 煤矿井下供电设计(张志飞).ppt
- 煤矿矿长七条规定解读(黄子建).ppt
- 煤炭行业GPS监控管理方案.doc
- 生鲜新零售供应链2025年采购成本分析与优化策略.docx
- 第4单元《比例》比例的基本性质 教学设计-2024-2025学年小学数学六年级下册同步教学(苏教版).docx
- 第23课 探索宇宙(教学设计)-2023-2024学年五年级科学下册同步精品课堂系列(粤教版).docx
- 基于2025年智能交通大数据的交通拥堵治理与智能交通信息服务优化报告.docx
- Unit 1 lesson 4 My school days教学设计2024-2025学年冀教版(2024)初中英语七年级上册.docx
- 数字艺术展览艺术展览数字化展示效果评估报告.docx
- 聚焦2025年消费升级,零售企业数字化转型中的技术创新与应用报告.docx
- O2O美容服务平台2025年运营模式创新与用户生命周期价值分析报告.docx
- 未来2025年再生医学技术在骨组织工程中的应用研究报告.docx
- 工业互联网平台赋能下的工业大数据挖掘与价值创造研究报告.docx
文档评论(0)