- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Num-近邻方差优化的K-medoids聚类算法.pdf
第32卷第 1期 计 算 机 应 用 研 究 Vo1.32No.1
2015年 1月 ApplicationResearchofComputers Jan.2015
Num一近邻方差优化的K·medoids聚类算法
谢娟英 ,高 瑞
(陕西师范大学 计算机科学学院,西安 710062)
摘 要 :针对Km·edoids聚类算法对初始聚类中心敏感、聚类结果依赖于初始聚类 中心的缺 陷,提 出一种局部方
差优化的K—medoids聚类算法,以期使K—medoids的初始聚类中心分布在不同的样本密集区域,聚类结果尽可能
地收敛到全局最优解。该算法引入局部方差的概念 ,根据样本所处位置的局部样本分布定义样本的局部方差,
以样本局部标准差为邻域半径,选取局部方差最小且位于不同区域的样本作为K.medoids的初始 中心,充分利用
了方差所提供的样本分布信息。在规模大小不等的UCI数据集以及带有不同比例噪声的不同规模的人工模拟
数据集上进行实验,并利用六种聚类算法性能测试指标进行测试,结果表明该算法具有聚类效果好、抗噪性能强
的优点,而且适用于大规模数据集的聚类。提出的Num一近邻方差优化的K.medoids聚类算法优于快速 K.me—
doids聚类算法及基于邻域的改进 K.medoids聚类算法。
关键词 :局部方差;Num一近邻 ;邻域 ;初始聚类 中心;聚类
中图分类号:TP181;TP301.6 文献标志码 :A 文章编号:1001—3695(2015)01—0030.05
doi:10.3969/j.issn.1001—3695.2015.Ol_007
OptimizedK--medoidsclusteringalgorithm byvarianceofNum--nearneighbour
XIEJuan—ying ,GAORui
(SchoolofComputerScience,ShaanxiNormalUniversity,Xi’an 710062,China)
Abstract:ToovercomethedisadvantagesofK medoidswhichwassensibletotheinitialseedsandwhoseclusteringdepended
ontheinitialseeds,thispaperproposedanew K—medoidsalgorithm toselectthesamplesindifferentdenseareaastheinitial
seedsandmadetheclusteringofK—medoidsconvergetotheglobaloptimalsolutionascouldaspossible.Thenew algorithmin—
troducedtheconceptofthelocalvariance,andgavethedefinitionusingthedistributionpatternofexemplarsinalocalarea.
Thenthelocalstandarddeviationwasregardedtheradiusoftheneighbourhood,SOthatthesampleswiththeminimum localva—
rianceandlyingatdifferentareaswerechosenasinitial seedsforK—medoids.Th eproposedalgorithm wastestedonthereal
datasetswithdifferentsizeofsamplesfrom UCImachinelearningrepositoryandonthesynhteticallygenerateddatasets
您可能关注的文档
- 1929年新康轮案研究.pdf
- 1999~2011年鄂尔多斯市温室气体足迹动态分析.pdf
- 2-2型多基元压电复合陶瓷圆管研究.pdf
- 2-甲基噻吩与NO_3反应机理的理论研究.pdf
- 2000年-2014年宋徽宗音乐理论研究综述.pdf
- 2000年以来国内抗战口述史研究综述.pdf
- 2000年至2013年中国大陆徐渭音乐理论研究综述.pdf
- 2003-2011年太原市大气环境质量评价及污染特征分析.pdf
- 2013年中超联赛攻防状况分析.pdf
- 2014年全国高中数学联赛几何证明题的一题多解——八种证法.pdf
- Oracle 11g R2版本中Data Guard的备用数据库类型分析.pdf
- Prezi在地理教学中的运用.pdf
- RCC、HXD常见故障处理以及节能操作方法.pdf
- SWOT模型分析法在低碳房地产业发展中的应用.pdf
- the Enlightenment to Children' s English Learning Based on APS and the Wolf-child.pdf
- Weyl型定理的稳定性.pdf
- YMnO3掺杂对BCZT无铅压电陶瓷性能的影响.pdf
- Y形图簇的伴随分解及其补图的色等价性.pdf
- ZSM-5MCM-41微-介孔复合分子筛的微波合成及表征.pdf
- 《中国好声音》对当代中学生产生的影响及对策.pdf
最近下载
- GPS控制网的布设方法.ppt.ppt VIP
- 公关语言学幻灯片.ppt VIP
- 2019版最新18项护理核心制度.docx VIP
- GPS静态网的布设.ppt VIP
- DB32T 2887-2016 曳引电梯钢丝绳电磁检测方法 .pdf VIP
- 《宁夏闽宁镇:昔日干沙滩,今日金沙滩》-中职语文高二同步课件精选(高教版2023·职业模块).pptx VIP
- 2025年5月18日河南省事业单位招聘考试《公共基础知识》试题(含答案).docx VIP
- 2025年5月18日河南省事业单位招聘考试《职业能力测试》试题(含参考答案).docx VIP
- 数据挖掘教案.doc
- DB42T 2390-2025 城市更新规划编制技术规程.docx VIP
文档评论(0)