- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微粒群并行聚类在客户细分中应用
微粒群并行聚类在客户细分中应用
收稿日期:2007-11-22;修回日期:2008-01-07
基金项目:重庆市自然科学基金资助项目(CSTC2007BB2406)
作者简介:王华秋(1975-),男,重庆人,副教授,博士后,主要研究方向为数据挖掘(wanghuaqiu@);廖晓峰,男,四川人,教授,博导,主要研究方向为计算智能.??*
(1?? 重庆大学 计算机学院,重庆400030;2?敝厍旃ぱг? 计算机学院,重庆 400050)
摘 要:提出了基于自适应微粒群优化的并行聚类算法,采用了任务分布方案和部分异步并行通信,降低了计算时间。这种并行自适应微粒群算法结合了并行微粒群算法的快速寻优能力和自适应参数动态优化特性,保持了群体多样性从而避免了种群退化。最后将该算法应用于电信客户细分中。实验证明,该算法在并行机群上具有了较好的准确性、加速性和可扩展性。
关键词:并行聚类;自适应;微粒群优化;电信客户细分
中图分类号:TP18
文献标志码:A
文章编号:1001-3695(2008)10-2987-04
Customer segmentation application of PSO parallel cluster
WANG Hua-qiu1,2, LIAO Xiao-feng1
(1. College of Computer, Chongqing University, Chongqing 400030, China;2. College of Computer, Chongqing Institute of Technology, Chongqing 400050, China)
Abstract:The paper presented the parallel cluster algorithm of adaptive particle swarm optimization, which adopted task parallelization and partial asynchronous communication to decrease the computing time. The proposed algorithm combined the fast search optimum ability of parallel particle swarm optimization with parameters dynamical optimization property of adaptive. It could maintain the individual diversity and restrain the degenerate phenomenon. Finally, the presented algorithm was used to analyze the telecom customer segmentation. The experiments indicate the presented algorithm on the cluster maintains pre-ferable accuracy, the speed-up and scaled-up.
Key words:parallel cluster; adaptive; particle swarm optimization; telecom customer segmentation
0 引言
客户细分就是企业在收集和整理客户信息资料的基础上,依据客户(包括消费者和分销商)的需求特点、购买行为、购买习惯、信誉状况等方面的明显差异,将某一产品的客户整体划分为若干个客户群的客户分类过程[1]。在商业决策支持应用中,需要用到聚类算法计算出需要的结果。由于聚类处理对象多为海量数据库和高维数据类型,算法计算的时间和空间复杂性很高[2]。聚类算法一般分为以下两种:
a) 硬聚类并行算法。这类算法在统计和数据库领域得到大量的研究和应用,早期有K-Means、K-Mediods,以后又有面向大规模数据库系统的BIRCH算法,处理非数值属性聚类的CACTUS算法[3]、处理空间数据的STING算法[4]、子空间聚类算法ENCLUS[5]等。这些并行聚类算法是基于共享存储系统等低通信延迟系统的,在设计算法时没有将通信代价作为重点来考虑。因而这些算法往往采用数据并行的设计思想,将局部聚类模式分布在各个计算节点中,以便可以并行地进行聚类模式匹配。这一过程中,匹配过程的启动及结果的收集和比较都需要通信。也就是说,处理的每―步
文档评论(0)