- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014 年 第 23 卷 第 12 期 计 算 机 系 统 应 用
基于相对密度和熵的混合属性聚类融合算法①
余 泽
(浙江工业大学 计算机科学与技术学院, 杭州 310023)
摘 要: 混合属性聚类是近年来的研究热点, 对于混合属性数据的聚类算法要求处理好数值属性以及分类属性,
而现存许多算法没有很好得平衡两种属性, 以至于得不到令人满意的聚类结果. 针对混合属性, 在此提出一种基
于交集的聚类融合算法, 算法单独用基于相对密度的算法处理数值属性, 基于信息熵的算法处理分类属性, 然后
通过基于交集的融合算法融合两个聚类成员, 最终得到聚类结果. 算法在 UCI 数据集 Zoo 上进行验证, 与现存
k-prototypes 与 EM 算法进行了比较, 在聚类的正确率上都优于 k-prototypes 与 EM 算法, 还讨论了融合算法中交
集元素比的取值对算法结果的影响.
关键词: 聚类融合; 混合属性; 信息熵; 相对密度
Clustering Ensemble Algorithm for Mixed Attributes Data Based on Relative Density and
Entropy
YU Ze
(College of Computer Science and Technology, Zhejiang University of Technology, Hangzhou 310023, China)
Abstract: Mixed attributes data clustering is a research hotspot in recent years. For mixed attributes data clustering
algorithm, it requires handling numeric attributes and categorical attributes simultaneously. However many algorithms
have not very good balance with numeric and categorical attributes, and the cluster results are not satisfied. For mixed
attributes data set, a new clustering ensemble algorithm based on intersection is proposed. It processes the numeric
attributes with a new relative density clustering algorithm, and processes the categorical attributes with a clustering
algorithm based on information entropy. Then it fuses these two cluster members with a cluster fusion algorithm based
on intersection. Finally, it gets the clustering results. It is validated by taking an experiment on UCI data set Zoo, and
compared with the existing k-prototypes algorithm and EM algorithm. The experiment result shows that the new
algorithm has higher flexibility and accuracy. The influence of the intersection element ratioand to the result is also
discu
您可能关注的文档
- 地下工程穿越既有道路设施技术规范-北京质量技术监督局.DOC
- 在理化试验教学中-物理-江苏中小学教学研究室.PPT
- 在大陆不要轻易的吃面.DOC
- 地形作用1全球板块分布图褶曲板块挤压前板块挤压后地垒与地堑.DOC
- 地方履约能力建设项目调研工作-广东生态环境厅.PPT
- 地点2010年海峡两岸大学生冰雪之情冬令营具体活动日程六-逢甲大学.PPT
- 地热回灌技术要求.DOC
- 地电场对裂隙岩块中溶浸液渗流特性影响的研究-岩石力学与工程学报.PDF
- 地震纵横波时差耦合作用的斜坡崩滑效应研究-工程地质学报.PDF
- 垄断资本全球化问题理论探讨-教学与研究.PDF
- 基于能量消耗和负载均衡的异构网络基站开闭策略研究.PDF
- 基于综合指数法的白龙江流域生物多样性空间分异特征-Open.PDF
- 基于结构元矿山产能分配模糊线性规划模型-计算机工程与应用.PDF
- 基于网络的师生发展平台有效性研究-张伟春-广东基础教育信息.PPT
- 基于能量的钢筋混凝土框架节点塑性铰长度的计算方法-工程科学与技术.PDF
- 基于虚拟仪器构建服装测量用温湿度仪-物理化学学报.PDF
- 基于表面模型的智能化塑料注射成型模拟-应用科学学报.PDF
- 基于超声波机械搅拌耦合作用下赤泥对二氧化碳的固化-环境工程学报.PDF
- 基于近红外和中红外光谱技术的小麦粉品质检测及掺杂鉴别-食品科学.PDF
- 基于迁移家庭资产选择行为的资产组合设计研究-南京农业大学学报.PDF
原创力文档


文档评论(0)