K-Means算法在客户细分中的应用的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘爱 摘要 无论是金融行业,还是电信行业,日益激烈的竞争使企业认识到客户是 他们真正的资产,主要工作也都是围绕保留现有客户和发展新客户展开,营 销方式也从大众化营销转为通过差异化、一对一营销来实现客户满意和公司 获利的双赢,而差异化、一对一营销的关键就是有效的客户细分。客户细分 的关键问题就是找出客户的特征,通过一些统计分析方法可以将客户隐藏在 数据中的特征挖掘出来,从而进行分类。 传统意义上,客户细分往往根据客户的一维属性来进行,如金融行业根 据客户资产多少,可以将客户分为高、中、低端客户,该细分方法最大的优 点是简单,可以方便地根据营销资源预算,取舍营销活动中的目标群体,在 实践中简便易行。但是,随着技术的进步与客户需求的日趋多样化,以及企 业产品的不断创新,传统的客户细分方法显现出了明显的缺点,即使同是高 端客户,客户对同一产品或服务的需求也存在着明显差别,客户对产品或服 务的要求日趋理性和严格,这种传统的基于一维的客户细分在实践中的应用 显得力不从心。需要一种新的细分方法,能够实现:客观反映客户分组内在 的特性;综合反映客户多方面的特征:有利于营销人员更加深入细致地了解 客户特征;便于实现对客户行为变化的动态跟踪。这就需要用几十个,甚至 上百个变量从而对客户进行更为精确的描述,在此基础上对客户进行更为精 确的细分,因而,用于解决多变量的、大数据量的客户细分的数据挖掘技术 也就应运而生了。 客户细分通常用聚类分析方法来实现,其中K-Means算法是实践中最为常 用的数据挖掘算法之一,在处理大数据量方面有绝对优势,而且可以取得较 好的效果。 在客户细分中,围绕K-Means聚类,如何依据通用的数据挖掘方法论,有 针对性地将K—Means应用于客户数据建模中,对这些问题的实证研究在国内尚 K-Means算法在客户细分中的应用研究 不多见。 因此,从数据挖掘建模的角度,对用K-Means算法对客户进行聚类的问题 进行理论分析和实证研究,具有一定的现实意义。 本文第一章主要阐述客户细分的研究背景,并说明研究的动机与目的以 及本文研究的步骤。 本文第二章对实现客户细分的相关技术理论进行了总结和回顾。利用数 据挖掘方法进行客户细分一个关键的问题就是客户细分方法论,在参阅大量 国内外理论研究和实践文献的基础上,归纳总结了客户细分方法论,作为后 续研究的基础。 客户细分通常用聚类分析方法来实现,在阐述了聚类分析相关概念如距 离、数据矩阵、变量标准化等基础上,重点分析了K—Means聚类的优点和缺点。 K-Means聚类是一种优化聚类算法,运算速度快,适宜处理大数据,但是聚类 结果与变量的量纲、异常值的处理方式、变量的维度、观测的顺序以及K个初 始凝聚点的选择等都有很大的关系,本章着重对影响K—Means聚类结果的因素 尤其是初始凝聚点的选择方法进行了理论上的分析和总结,也对K—Means聚类 在实际中应用状况进行了文献回顾和探讨。 聚类结果对实际是否有意义,需要对结果从技术和业务两个方面进行评 估,本章对聚类结果好坏的评价标准进行了探讨。K-Means算法对高维数据的 聚类效果较差,本文引进用主成分分析方法对高维数据进行降维。 本文第三章,实证分析架构设计,也就是本论文实证研究方法。CRISP—DM StandardProcessforData (Cross—Industry Mining)是公认的、较有影 Miner提出来的一种对数据挖掘实施核心过程的描述。本文在研究CRISP—DM以 及SASS蹴淞的基础上,结合实际情况设计本研究的实证分析流程,探索利用 K-Means聚类进行客户细分的一般数据挖掘流程和方法。 本文第四章在某银行客户数据的基础上,借助SAs/STAT、EM所提供的统 计分析和数据挖掘方法,围绕认识和理解客户的目标,主要利用K—Means算法 对客户数据进行实证分析,探索K-Means聚类用于客户细分的主要过程和一般 分析方法。 本章共对比了实践中比较常用的八种选择初始凝聚点的方法,对他们的 2 摘要 聚类结果进行了对比分析,并给出方法实现的SAS代码。这八种方法共分为两 种类别:合成初始凝聚点的方法:实际观测点作为初始凝聚点的方法。前

文档评论(0)

liybai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档