- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘爱
摘要
无论是金融行业,还是电信行业,日益激烈的竞争使企业认识到客户是
他们真正的资产,主要工作也都是围绕保留现有客户和发展新客户展开,营
销方式也从大众化营销转为通过差异化、一对一营销来实现客户满意和公司
获利的双赢,而差异化、一对一营销的关键就是有效的客户细分。客户细分
的关键问题就是找出客户的特征,通过一些统计分析方法可以将客户隐藏在
数据中的特征挖掘出来,从而进行分类。
传统意义上,客户细分往往根据客户的一维属性来进行,如金融行业根
据客户资产多少,可以将客户分为高、中、低端客户,该细分方法最大的优
点是简单,可以方便地根据营销资源预算,取舍营销活动中的目标群体,在
实践中简便易行。但是,随着技术的进步与客户需求的日趋多样化,以及企
业产品的不断创新,传统的客户细分方法显现出了明显的缺点,即使同是高
端客户,客户对同一产品或服务的需求也存在着明显差别,客户对产品或服
务的要求日趋理性和严格,这种传统的基于一维的客户细分在实践中的应用
显得力不从心。需要一种新的细分方法,能够实现:客观反映客户分组内在
的特性;综合反映客户多方面的特征:有利于营销人员更加深入细致地了解
客户特征;便于实现对客户行为变化的动态跟踪。这就需要用几十个,甚至
上百个变量从而对客户进行更为精确的描述,在此基础上对客户进行更为精
确的细分,因而,用于解决多变量的、大数据量的客户细分的数据挖掘技术
也就应运而生了。
客户细分通常用聚类分析方法来实现,其中K-Means算法是实践中最为常
用的数据挖掘算法之一,在处理大数据量方面有绝对优势,而且可以取得较
好的效果。
在客户细分中,围绕K-Means聚类,如何依据通用的数据挖掘方法论,有
针对性地将K—Means应用于客户数据建模中,对这些问题的实证研究在国内尚
K-Means算法在客户细分中的应用研究
不多见。
因此,从数据挖掘建模的角度,对用K-Means算法对客户进行聚类的问题
进行理论分析和实证研究,具有一定的现实意义。
本文第一章主要阐述客户细分的研究背景,并说明研究的动机与目的以
及本文研究的步骤。
本文第二章对实现客户细分的相关技术理论进行了总结和回顾。利用数
据挖掘方法进行客户细分一个关键的问题就是客户细分方法论,在参阅大量
国内外理论研究和实践文献的基础上,归纳总结了客户细分方法论,作为后
续研究的基础。
客户细分通常用聚类分析方法来实现,在阐述了聚类分析相关概念如距
离、数据矩阵、变量标准化等基础上,重点分析了K—Means聚类的优点和缺点。
K-Means聚类是一种优化聚类算法,运算速度快,适宜处理大数据,但是聚类
结果与变量的量纲、异常值的处理方式、变量的维度、观测的顺序以及K个初
始凝聚点的选择等都有很大的关系,本章着重对影响K—Means聚类结果的因素
尤其是初始凝聚点的选择方法进行了理论上的分析和总结,也对K—Means聚类
在实际中应用状况进行了文献回顾和探讨。
聚类结果对实际是否有意义,需要对结果从技术和业务两个方面进行评
估,本章对聚类结果好坏的评价标准进行了探讨。K-Means算法对高维数据的
聚类效果较差,本文引进用主成分分析方法对高维数据进行降维。
本文第三章,实证分析架构设计,也就是本论文实证研究方法。CRISP—DM
StandardProcessforData
(Cross—Industry Mining)是公认的、较有影
Miner提出来的一种对数据挖掘实施核心过程的描述。本文在研究CRISP—DM以
及SASS蹴淞的基础上,结合实际情况设计本研究的实证分析流程,探索利用
K-Means聚类进行客户细分的一般数据挖掘流程和方法。
本文第四章在某银行客户数据的基础上,借助SAs/STAT、EM所提供的统
计分析和数据挖掘方法,围绕认识和理解客户的目标,主要利用K—Means算法
对客户数据进行实证分析,探索K-Means聚类用于客户细分的主要过程和一般
分析方法。
本章共对比了实践中比较常用的八种选择初始凝聚点的方法,对他们的
2
摘要
聚类结果进行了对比分析,并给出方法实现的SAS代码。这八种方法共分为两
种类别:合成初始凝聚点的方法:实际观测点作为初始凝聚点的方法。前
您可能关注的文档
- 我国大部门体制改革的理论与实践探析.pdf
- AERMOD数值原理及其模型演化分析与验证.pdf
- BCS-BEC交叉区域囚禁费米凝聚体基态与激发谱的理论的研究.pdf
- 我国担保业营销理论与实践的研究.pdf
- BP神经网络在煤与瓦斯突出危险性预测中的应用的研究.pdf
- C-%274-ISR系统目标综合识别理论与技术的研究.pdf
- CFRP加固修复钢构件界面性能试验的研究和理论分析.pdf
- CR航空公司经营战略的研究.pdf
- 我国房地产宏观调控法律规制对策的研究.pdf
- 我国房地产信贷风险影响因素分析及其防范措施的研究.pdf
- MEMS纳观摩擦机理的研究.pdf
- Mie氏粒度仪独立模式算法的数值实验的研究.pdf
- MIMO%2fUWB无线信道特性的研究与建模.pdf
- Ni%2fα-Al-%2c2-O-%2c3-的结构及在POM中催化性能的DFT的研究.pdf
- N微电子科技有限公司研发人员激励机制的研究与再设计.pdf
- P2P网络缓存技术研究与应用.pdf
- PMBOK在低碳建筑业阶段行动中的应用的研究.pdf
- Ptn%2b%2fPtn-(n%3d3-6)异构体及其单重态和三重态Pt2催化甲烷脱氢的量子化学的研究.pdf
- PVC型材设计项目质量管理的研究_以宝硕型材公司PLUS80系列型材设计项目质量管理为例.pdf
- SIR型传染病的模糊控制与预测.pdf
文档评论(0)