- 43
- 0
- 约1.57万字
- 约 4页
- 2018-05-09 发布于福建
- 举报
总第289期 计算机与数字工程 Vo1.41No.11
2013年第 儿期 Computer DigitalEngineering 1713
K均值算法的K值优化研究和应用
孙镇江 梁永全 樊建聪 马远坤 梁天一
(山东科技大学信息科学与工程学院 青岛 266590)
摘 要 在数据挖掘领域,K均值算法是一种经典的聚类算法,但 K值需要事先设定,并且 K均值算法的性能易受 K值的影响,随着
大数据时代的到来,用户很难准确确定K值。论文结合计算机操作系统中内存分配的循环首次适应算法和基于密度聚类的方法,以及分布
式估计算法 (EDAs)提出了基于密度的循环首次适应K值优化算法来优化K值 ,用理论验证算法的可行性 ,并运用K均值中文文本聚类验
证算法的有效性。
关键词 K均值;分布式估计 (EDAs);阈值;密度
中图分类号 TP181 DOI:10.3969/j.issn1672—9722.2013.11.001
OptimizationStudyandApplicationonK ValueofK-meansAlgorithm
SUNZhenjiang LIANGYongquan FANJiancong MAYuankun LIANGTianyi
(CollegeofInformationScienceandEngineering,ShandongUniversityofScienceandTechnology,Qingdao 266590)
Abstract TheK—meansalgorithm isaclassicalclusteringalgorithm inthefieldofdatamining.ButtheK valueneedstobesetinad—
vance,andtheperformanceofK—meansalgorithm issusceptibletotheimpactoftheK value.W iththeadventoftheeraofbigdata,theuser
isdifficulttoaccuratelydeterminetheK value.BeaimedatoptimizingtheK value,thispaperputsforwardaalgorithm namedtheDensity-
basedandNextfitoftheK valueoptimizationalgorithm ,whichcombinesthenextfitofmemoryallocationincomputeroperatingsystem and
thedensity-basedclusteringmethod,asweIlasthedistributedestimationalgorithms(EDAs).Thetheoryisusedtoverifythefeasibilityof
thealgorithm andverifytheeffectivenessofthealgorithmbyusingoftheK—meansChinesetextclustering.
KoyWords K—means,estimationofdistributionalgorithms(EDAs),threshold,density
ClassNumtmr TP181
知道真实的K值,这样,就会影响K均值算法的效果。
1 引言
本论文主要研究K均值的第2)缺点,关于第2)缺点,许多
聚类 [】]是一个把数据对象集划分成多个组或簇的过 学者已经做了大量的研究工作:BezdekJC[。]提出基于样本隶
程。随着大数据时代的到来,聚类作为一种数据挖掘工具 属度的划分概念,聚类个数K通过满足min(Jm(U,c))获得,其
已经根植于很多应用领域,如生物学、安全、商务智
您可能关注的文档
最近下载
- 2026年湖南高速铁路职业技术学院单招职业适应性测试题库附答案.docx VIP
- 5G网络优化:5G网络性能优化_(2).5G无线接入技术.docx VIP
- 2026年《国企时事政治试题及完整答案.docx VIP
- 山东外贸职业学院单招语文模拟试题及答案.docx VIP
- 2024CSCO头颈部肿瘤诊疗指南.pptx VIP
- 【倍福BECKHOFF】手册:TwinCAT 2 PLC入门教程V2.42.pdf VIP
- 人教版劳动教育四年级下册全册教案.pdf VIP
- (2026春新版)教科版二年级科学下册《1.1 恐龙的故事》PPT课件.pptx VIP
- 2025年烟台南山学院单招综合素质考试题库及答案一套.docx VIP
- 2026年湖南高速铁路职业技术学院高职单招职业适应性测试备考试题及答案解析.docx VIP
原创力文档

文档评论(0)