基于Kmeans算法的客户分群模型构建与应用.docVIP

下载本文档

79
0
约4.33千字
约 7页
2018-11-02 发布于广东
举报
版权申诉

基于Kmeans算法的客户分群模型构建与应用.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Kmeans算法的客户分群模型构建与应用.doc

基于K-means算法的客户分群模型构建与应用尹玉芬（广东电网有限责任公司东莞供电局广东东莞523008）随着客户对供电服务的要求不断提升，供电企业有必要进行客户分群，实施差异化服务。基于数据挖掘的聚类分析，从客户行为特征、价值特征、需求特征三个维度，利用K-means算法构建了价值贡献度的客户分群模型，能够较好地满足供电企业客户分群的需求。通过甄別出不同价值贡献度的客户群体，合理分源，制定合适的经营策略，提升企业的竞争力和经济效益。关键词：客户分群；数据挖掘；聚类分析；K-means算法；价值贡献度 0引言随着经济的发展，电力市场的逐步开放，客户对电力产品及服务要求不断提高，企业需要持续提高客户满意度，实现差异化服务的前提和基础是进行客户细分管理［1］。文献［2】指岀，客户分群是基于现有客户服务数据资源，有效利用决策支持平台，按照客户价值、客户行为及客户需求进行客户细分，并作为制定客户营销服务策略的依据。帕累托法则（二八定律）表明，一个企业80%的利润来自它20%的客户。供电企业如何维持与20%价值贡献度高的客户良好的关系，提升企业的竞争力和经济效益，因此利用数据挖掘方法对客广进行细分是具有应用价值的研究。参考数据挖掘技术在客户分群中运用，文献［3］利用基于群体智能的聚类方法对客户行为进行分析，采用递归算法收集聚类效果，以获得不同消费特征的客户群体。文献［4］利用模糊C均值聚类算法作为客户聚类的方法，为客户分群的特征分析提供了量化依据，并获得较为满意的客户聚类结果。文献［5］利用基于密度的聚类方法，以获取高端消费模式的客户特征，为其提供满意的产品和服务。目前，供电企业对电力客户的数据运用，局限于简单的数据记录和单一维度的比较，缺乏深层次、多维度数据结合的分析；企业内部管理，更多的是根据经验判断，缺乏科学的依据和算法，未能反映客户的正真需求［6】。因此，本文从行为特征、价值特征、需求特征三个维度构建电力客户分群模型，突出客户的多维度属性，运用K-means算法，挖掘客户数据背后的规律和要求，并以某供电企业的客户数据为例进行实证分析。 1客户分群建模 1.1客户分群维度客户价值，主要分为当前价值和潜在价值两类。其中，当前价值主要反映客户目前对于企业收益的价值大小；潜在价值主要反映客户未来的发展状况对于企业收益的影响大小。客户行为，主要分为用电行为和交互行为两类。其中，用电行为主要反映客户在用电过程中的行为特征与偏好；交互行为主要反映客户与供电企业在业务往来和沟通交流过程中的行为特征与偏好。客户需求，主要分为基本型需求、期望型需求和兴奋型需求三类。其中，基本型需求反映客户对于电力产品和服务的基本要求；期望型需求反映客户对于优质电力产品和服务的要求；兴奋型需求反映令客户意想不到的电力产品和客户服务特征。 1.2客户分群特征指标结合供电企业的实际运营和营销信息系统数据记录的情况，进一步选定合适的指标作为建模需要的变量，综合［7, 8, 9］，共选取36个字段用于建模。评价指标的选取如表1所示。表1客户特征指标 2基于K-means聚类算法的客户分群建模 2.1K-means聚类算法图1使用K-means算法聚类对象集对存在于营销信息管理系统海量的电力客户数据进行分析，应用多字段数据，挖掘数据规律，刻画不同的消费群体的特征，根据需求相似原则对客户实施细分，因此选择使用K-means聚类算法进行分类。 K-means聚类算法由Mac Q首先提出，把n个对象分为k个簇，以使簇内具有较高的相似度。相似度的计算根据一个簇中对象的平均值来进行。K-means算法采用迭代更新的思想，首先随机地选择k个对象，每个对象代表一个簇的初值均值或中心。对剩下的每个对簇，根据其与各个簇中心的欧氏距离，将它分配到最相似的簇，然后K-means算法迭代地改善簇内变差。对于每个簇，它使用上次迭代分配到该簇的对象，计算新的均值，然后使用更新后的均值作为新的簇中心，重新分配所有对象。迭代继续，直到分配稳定，即本轮形成的簇与前一轮形成的簇相同。迭代使得选取的聚类中心越来越接近真实的簇中心，所以聚类效果越来越好，最后把所有对象划分为k个簇［10】。 K-means算法的具体步骤：输入：聚类个数k和包含n个对象的数据集)(=卜1，x2，……，xn｝，输出：k个簇｛SI, S2，……，Sk｝,使目标函数最小。选取聚类个数k; 从数据集中随机选定k个对象作为初始聚类中心cl, c2,……ck；逐个将对象xi (i=l,2,……，n)按欧氏距离分配给距离最近的一个聚类中心 cj, llt;jlt;k, 其中m是数据属性的个数；计算各个聚类新的中心cj， cj