网站大量收购独家精品文档,联系QQ:2885784924

引力聚类及其应研究.pdf

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
引力聚类及其应研究

摘要 摘要 数据挖掘是近年来热门的计算机应用技术,聚类是数据挖掘中重要的研究分 支。聚类技术是将未分类的样本,通过其相似度进行分类,使得类簇内部样本间 相似度最大,而不同类簇间相似度最小,从而发现数据集的特性和内部模式。然 而,一些数据集的结构和分布呈现高度复杂性,数据挖掘也为聚类带来了大量亟 待解决的问题。因此,聚类分析方法进一步研究的空间还很大。 层次聚类方法是一种常用的聚类算法,通过分解目标数据集来创建一个层次。 按照层次的分解方向,它分为自下而上(凝聚方法)和自上而下(分裂方法)两 种类型。 覆盖算法是构造型学习算法,通过找到一组覆盖,使得属于同一类的样本属 于同一覆盖,不同类的样本不属于同一覆盖。覆盖聚类算法借鉴覆盖算法的构造 性思想,找出一组覆盖,使得属于同一覆盖的样本间距离较小,不同覆盖间的样 本间距离较大。我们生活的宇宙,从最初的宇宙大爆炸,宇宙所有的物质都处于 混沌状态中,杂乱无章。由于万有引力的作用,使得宇宙中的物质相互吸引、靠 近,进而融合形成了星系,恒星,行星等天体。这一过程和数据聚类过程极为相 似,都是从最初混沌,通过对混沌中的个体进行某种聚类运算,最终得到结构清 晰的聚类结果。正是由于这种相似性,我们把万有引力融入聚类算法中,改进相 似度的度量方法,即从单纯的距离作为相似度,到距离与类簇的大小比值作为相 似度。本文中研究了层次聚类算法(HierarchicalClustering,HC)和覆盖聚 类算法(Coveringclusteringalgorithm,CCA),在这两个算法中,本文用引 力替代距离作为相似度计算公式,提出基于引力的层次聚类算法(Hierarchical Basedon Clustering Basedon ClusteringGravity,CCBG)。实验结果表明以引力作为相似度的聚类 结果有一定的改进。 客户关系管理(Customer RelationshipManagement,CRM)将最佳的商业实 践与数据挖掘、数据仓库、一对一营销、销售自动化以及其它信息技术紧密结合 在一起,为企业的销售、客户服务和决策支持等领域提供了一个业务自动化的解 决方案。客户细分是CRM技术中一项重要研究内容,通过对客户的有效分类,采 用针对性销售策略,达到销售利润最大化。在客户细分中,最重要的两个步骤是 引力聚类及其应用研究 数据挖掘和决策支持,数据挖掘即通过聚类算法找出具有相似行为的客户;决策 支持即通过贝叶斯分类、决策树等方法,根据某一客户的个人资料,预测他的行 为。本文在数据挖掘过程中采用基于引力的层次聚类算法,并通过朴素贝叶斯分 类方法,对客户的行为进行了预测。 关键字:引力;聚类;层次聚类;覆盖算法;客户关系管理;客户细分 Abstract Abstract Data the of inrecent miIliI鸣isimportantapplicationtechnologyyears,data kind isthe branchofdata of isto clusteringimportant mining.Thistechnology to thosenotclassified Some its the by separate samples groups similarity,making inone is andindifferentis the similar

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档