- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自适应最近邻域图构造
学生:洪晓路 指导教师:朱庆生 一. 研究此项课题的目的 二. 研究过程与结果展示 二. 研究过程与结果展示 三.总结与展望 3、比较自然最近邻居和k最近邻居在各应用邻域中的效果; 自适应最近邻域图的 构造算法研究 1.解决悬而未决的历史问题——“K参数选择问题” 2.研究已有的自然最近邻居搜索算法的性质从而改进算法 3.用改进后的算法构造自适应邻域图 nb数值与点结构特征之间的关系 nb数的四个典型值与点分布的关系 (四个典型值即:最大值、最小值、平均值和互为nb的值) 最大值在数据分布集中的地方 最小值在远离数据集中的地方,即离群点 同一规模下平均值的点较多的分布均匀 互为nb值的点分布体现核心结构 (nb最小值与最大值的分布) (绿色为均值点,左边为均匀分布、右图为高斯分布) (互为nb值) (高斯分布数据集) 随机高斯分布数据集规模在100~500时nb值基本稳定在6左右,后面缓慢增长分别为8、11、14。 随机均匀分布数据集规模在100~3000时从4极其缓慢均匀增长到7。 nb数值与数据规模之间的关系 nb数值与数据规模之间的关系 nb数值与点结构特征之间的关系 nb数值与点结构特征之间的关系 离群点对nb数值的影响 删除离群点,nb值总体大幅度下降。 离群点的存在对于算法的计算结果有较大影响,导致算法不稳定。 原算法健壮性不好。 二. 研究过程与结果展示 (数据集点分布) (数据集中每个点的nb值) (去除离群点的每个点的nb值) (去除中心点的每个点的nb值) nb数值与点结构特征之间的关系 RepeatZeronum=5时 效果最好 改变终止条件,得到改进后的算法 新的变量:zeronum 二. 研究过程与结果展示 构造自适应邻域图 构建自然最近邻域理论模型——邻居对象集 连接目标对象与其邻居对象集中的每个邻居点 自然最近邻域理论模型:supk、nb(i)、max{nb(i),Supk}、min{ nb( i ) , Supk }、互为邻居。 密度信息明显 二. 研究过程与结果展示 构造自适应邻域图 聚类效果 好 逼近低维数据流形 不受离群点影响 二. 研究过程与结果展示 谢谢各位老师! 谢谢各位同学!
文档评论(0)