CPDA考试 移动客户细分聚类.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CPDA考试 移动客户细分聚类

假如你是某移动运营商的数据分析师,结合用户通话行为数据,通过数据分析为用户推荐相应套餐或者结合用户现有套餐优化套餐,提供个性化套餐,从而对客户进行精准营销,增加客户粘性。 运营商收集到的数据包含下列字段; 变量名称 变量标签 Customer_ID 用户编号 Peak_mins 工作日上班时间电话时长 OffPeak_mins 工作日下班时间电话时长 Weekend_mins 周末电话时长 International_mins 国际电话时长 Total_mins 总通话时长 average_mins 平均每次通话时长 根据客户行为数据,进行数据的预处理(可以自行根据现有变量构造新变量进行分析),预处理之后选择适合变量进行分析,分析算法自行选择,写出分析思路和过程,通过数据分析对客户进行细分,并为运营商提供客户精准营销的相关建议。(请写出分析的流程并刻画最后细分之后的客户的特点和相应的营销建议)。 K-Means据类的步骤: 确定所有聚类变量(聚类因子); 数据预处理(分类变量数值化、处理缺失值、分析是否存在共线性等,若只有两个变量共线则用比值法,较多变量共线用主成分分析进行降维); 确定聚类个数并用处理后的聚类因子进行聚类分析(若未说明则需要尝试不同的聚类个数[3,4,5,6,7],从中选择平均轮廓系数较大且结果易于分析解释的模型); 分析聚类效果和聚类结果(类中心点和每个类等); 结合实际情况分析每类的意义等 。 (聚类分析处理共线性时不能直接删除,可用比值替代或主成分分析等来消除共线性) 案例分析: 观察数据类型,检查数据是否具有缺失值。数据类型为数值型,原始数据没有缺失值。我们把数据导入DATAHOOP平台,在展示分析中进行异常值分析。分析结果如下表:   Peak_mins OffPeak_mins Weekend_mins 上四分位 1382.1 426.825 74.875 中间值 1030.2 274.05 44.4 下四分位 700.2 154.425 25.05 异常值个数 6 5 5   International_mins Total_mins average_mins 上四分位 389.03 1781.3 4.2075 中间值 294.075 1370.85 2.73 下四分位 221.2275 1094.925 2.1 异常值个数 13 11 36 由上面可以得到异常值的个最多的具有36个,在数据总体样本中占比比较大。所以不处理异常值,这些异常值有可能是数据中一些特殊的类。 进行相关系数矩阵分析,分析得到的相关系数矩阵如下:   Peak_mins OffPeak_mins Weekend_mins International_mins Total_mins average_mins Peak_mins 1 0.121 0.1448 0.6915 0.9415 -0.0367 OffPeak_mins 0.121 1 0.0247 0.262 0.4425 0.0094 Weekend_mins 0.1448 0.0247 1 0.1282 0.2006 -0.1066 International_mins 0.6915 0.262 0.1282 1 0.7123 -0.034 Total_mins 0.9415 0.4425 0.2006 0.7123 1 -0.0364 average_mins -0.0367 0.0094 -0.1066 -0.034 -0.0364 1 观察相关系数矩阵中有一个相关系数为0.9415,该系数比较大。所以我们要处理,我们用比值替换法(把两个变量做比,得到的比值替换其中的一个变量)。我们在数据中重新插入一列为Peak_minsTotal_mins得到他们的变量比值,替换Peak_mins变量。得到新的变量,我们把新的   OffPeak_mins Weekend_mins International_mins Total_mins average_mins Peak_mins/Total_mins OffPeak_mins 1 0.0247 0.262 0.4425 0.0094 -0.4771 Weekend_mins 0.0247 1 0.1282 0.2006 -0.1066 0.0079 International_mins 0.262 0.1282 1 0.7123 -0.034 0.3939 Total_mins 0.4425 0.2006 0.7123 1 -0.0364 0.4492 average_mins 0.0094 -0.1066 -0.034 -0.0364 1 0.0116 Peak_mins/Total_mins -0.4771 0.

您可能关注的文档

文档评论(0)

cgtk187 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档