基于数据挖掘技术的客户细分模型研究.docxVIP

基于数据挖掘技术的客户细分模型研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘技术的客户细分模型研究 杨登 吉林化工学院 132022 摘要客户细分是客户关系管理中的首要任务,数据挖掘技术是实施客户细分 的关键技术。木文介绍如何将SOM神经网络算法和k均值算法相结合,构建一 种客户细分模型。 关键词 客户细分 SOM神经网络算法 k均值算法 细分模型 1.介绍 对于现代企业而言,相互之间的竞争已从产品的样式和质量上的竞争转 移到争夺客户的竞争上来了。面对日益激烈的市场竞争,企业逐渐意识到维系与 顾客之间的长久关系的重要性。数据挖掘技术可以企业在海量数据中同时更好地 理解客户,找出高价值或者至少有利润的客户,并将这些客户进行适当的分类, 由此决策者便能够对每一类客户提供有针对性的个性化服务。 国外诸多学者从人口统计、客户行为、价值、利益、忠诚等角度出发, 获得了一些不同的细分方法。这些细分方法在实际运用中都取得了一定成效,而 目前占据主流地位的还属基于行为和价值的客户细分方法。基于行为的细分方法 认为行为变量是构建细分市场的最佳起点,通过对客户行为的测量,对客户进行 分类;而基于价值的细分方法则认为客户的价值是构建细分市场的最佳起点,通 过分析不同客户给企业带来的盈利,来对客户分类。 目前客户终身价值的研究还不成熟,客户细分更多采用基于行为的分类方法。木 文介绍的客户细分模型也是基于行为分类,在选定了特定的行为变量后,比较了 SOM神经网络算法和k均值算法的优缺点,结合两个算法构建一个客户细分的 模型。 2 ?模型实现的方法 2.1行为变量的选取 木文在选取细分的行为变量时,在客户价值矩阵的两个变量基础上,增 加了一个反应客户忠诚度的变量-客龄。客龄等于客户的开户日期与最近购买日 期的吋间差,单位为天数。也就是说,一共选取了三个行为变量,分别为平均购 买金额A,购买次数F和客龄D。 2.2算法的设计 K?均值的优缺点 K■均值算法的优点是简单、快速、有效。该算法的缺点是①不同初始值 会导致不同的聚类结果;②要求事先输入聚类数目;③陷入局部极优;④对“噪 声”和孤立点数据比较敏感。 SOM算法的优缺点 SOM算法的优点是①由于不需要映射内的相互结合,计算量少;②算 法中不需要微分计算,数学上非常简单。SOM的缺点是①SOM不能提供分类后 精确的聚类信息,②缺乏具体的目标函数,使得不同SOM聚类的结果难以进行 比较;③必须设定初始邻域宽度、初始学习率、网络类型、邻域函数这许多的参 数。 2.2.3结合算法 K?均值需要指定聚类的个数,且初始的聚类质心是随机赋予的;而SOM 只需输入向量就能产生分类。可将两种算法结合起来,形成一个结合算法。第一 步,先执行SOM算法,输出聚类数目N和聚类质心Z={Z1, Z2, ?, Zc}o第二步, 将SOM输出的结果N, Z={Z1, Z2, ?, Zc},用做K■均值算法的初始化条件,得到最 后的聚类的结果。将两个算法结合起来后,因为得到合适初始值,K?均值算法的 局部搜索能力变强,收敛速度提高。 2.3数据准备 客户信息表:共有9876条记录,经筛选保留字段为客户号、性别、年 龄、受教育程度、婚否、未成年孩子的个数、职业、收入、房产、汽车、注册日 期等。 商品数据表:有1561条记录,经筛选保留字段为商品号、商品名和商 品属类标识。 交易记录表:有97425条记录,经筛选保留字段为商品号客户号、单价、 数量、小计、日期。 建模的样本数据集由上述基本表融合而生成,新增变量平均购买金额、 购买频率、客龄,在数据清理后,采用最小一最大标准将属性值标准化到[0, 1], 形成我们的挖掘数据库。 3 ?模型评估 3.1基于SOM网络的聚类质心 经过预定次数的训练之后,客户被自动分为了5类,所得各簇的聚类质 心如表1所示: 表1SOM聚类质心 簇 C1 C2 C4 C5 平均购买额 0.334 0.241 0.235 0.235 0.34 购买次数 0.113 0.076 0.114 0.08 客龄 0.782 0.627 0.524 0.418 0.272 3.2基于K■均值的聚类质心 为了进行比较,对样本数据指定K=5,执行k■均值后所得各簇的聚类质 心如表2所示: 表2 K?均值聚类质心 Cl C2 C3 C4 C5 平均购买额 0.345 0.419 0.307 0.325 购买次数 0.58 0.087 0.091 客龄 0.553 0.53 0.509 3.3基于结合算法的聚类质心 样本数据采用结合算法后,所得各簇的聚类质心如表3所示: 表3结合算法聚类质心 C1 C2 C3 C5 平均购买额 0.362 0.413 0.154 购买次数 0.078 0.067 0.047 0.066 0.293 客龄 0.445 0.803 0.533 3.4三种方法的

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档