聚类融合算法分析与其在电信客户细分中的应用.pdfVIP

  • 6
  • 0
  • 约4.95万字
  • 约 53页
  • 2018-12-04 发布于江苏
  • 举报

聚类融合算法分析与其在电信客户细分中的应用.pdf

聚类融合算法分析与其在电信客户细分中的应用

硕士论文 聚类融合算法研究及其在电信客户细分中的应用 法、混合模型算法和超图算法(CSPA,HGPA,MCLA)等经典和高效的算法。 聚类融合技术历经愈十年的发展,虽然也取得了一些成就,但在这一领域的研究 还远远未达到成熟的地步,有一些问题是需要亟待解决的: 1、最终的聚类个数K如何选取,始终是聚类研究的重点和难点问题,K值的选择 不同,会导致最终结果的千差万别,在聚类融合中,怎样确定聚类成员的K值以及最 终融合结果的K值,值得进一步探讨。 2、由于聚类成员的质量有时差别也会很大,所以有必要对聚类成员的质量给予一 个量化的标准,同时,如何对质量不同的聚类成员赋予相应的权值,也是未来研究的 重点之一。 3、对于海量数据、高维数据、混叠数据等特定数据类型,在差异度量化分析以及 提高融合效率等方面,还需要作进一步研究,尤其是在聚类成员之间互相不独立的情 况下。 4、考虑到“硬”聚类算法和“软”聚类算法各自的优点和局限性,那么对于 “硬聚类成员和“软’’聚类成员同时存在的情况下,如何将二者高效统一也是值得 关注和具有挑战性的热点问题。 5、聚类融合算法的可扩展性、增量性研究对于更广泛的实际应用也具有十分重要 的意义。 1.3论文内容及结构 本论文深入分析研究了数据挖掘中的聚类和聚类融合技术,着重对一些经典的算 法进行横纵向比较,并针对目前聚类融合算法中存在的问题和局限性,引入了一种基 于PCA的加权聚类融合算法(PCA.basedClustering PCA的思想来确定化初始聚类中心,避免了随机选取初始聚类中心产生的问题;同 时,算法采用质量系数和K值系数作为权值的分配依据,通过加权的方式对各个聚类 成员进行融合,最大限度的降低干扰。最后,将改进的算法应用到电信的客户细分 中。 论文框架结构如下: 第一章绪论,概述了数据挖掘的产生和发展状况,并简要介绍了聚类分析及聚类 融合的技术背景和国内外发展现状。 第二章重点介绍了聚类分析,从聚类的定义、数据的组织和表示、聚类算法的分 类、聚类的评价标准以及经典算法的对比等几个方面,深入研究了聚类和聚类技术的 发展状况和应用前景。 3 1绪论 硕士论文 第三章是聚类融合技术部分,介绍了聚类融合的算法思想以及与单一聚类算法相 比较所体现出的优势,着重分析讨论了常见的聚类融合算法,最后介绍了聚类成员之 间的相异度度量准则。 第四章是本论文的核心章节,在现有的融合算法的思想基础上,引入一种基于 PCA的加权融合,用PCA算法来产生聚类成员,避免了选取初始聚类中心不当产生的 干扰,同时将聚类成员的K值评价和质量评价融入到加权函数中,并对算法进行了仿 真实验和结果分析。 第五章详细介绍了客户细分以及客户细分在电信行业的战略地位,并根据电信数 据量大的特点,采用Delaunay三角网进行粗抽样,然后将改进后的融合算法用于客户 细分模型中,结果证明该算法能有效将客户细分为具有不同特征行为的集群,对决策 者制定营销策略提供了帮助。 4 硕士论文 聚类融合算法研究及其在电信客户细分中的应用 2聚类算法综述及经典聚类算法比较 将对象按照其相似性分成相应的簇集的过程称为聚类。聚类结果的每一个簇都是 对象的集合,聚类的目的就是使得同一个簇集中的对象之间最大程度地相似,而不同 簇集中的对象最大程度地不同。 假设X代表一组数据集,s和d表示度量标准(s是相似性度量函数,d是相异度度 量函数),那么聚类分析的输入可以用数据集和相应的度量函数组成的有序对来表示, (i-1,2,3…k)是X的子集,且满足下列条件[21: C1UCU…UC:=X (2.1) enC,=巾,f,/=1,2,3..七f≠, (2.2) 2.1聚类的流程及聚类算法的分类 2.1.1聚类的流程

文档评论(0)

1亿VIP精品文档

相关文档