- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CPDA考试 移动客户细分聚类
假如你是某移动运营商的数据分析师,结合用户通话行为数据,通过数据分析为用户推荐相应套餐或者结合用户现有套餐优化套餐,提供个性化套餐,从而对客户进行精准营销,增加客户粘性。
运营商收集到的数据包含下列字段;
变量名称
变量标签
Customer_ID
用户编号
Peak_mins
工作日上班时间电话时长
OffPeak_mins
工作日下班时间电话时长
Weekend_mins
周末电话时长
International_mins
国际电话时长
Total_mins
总通话时长
average_mins
平均每次通话时长
根据客户行为数据,进行数据的预处理(可以自行根据现有变量构造新变量进行分析),预处理之后选择适合变量进行分析,分析算法自行选择,写出分析思路和过程,通过数据分析对客户进行细分,并为运营商提供客户精准营销的相关建议。(请写出分析的流程并刻画最后细分之后的客户的特点和相应的营销建议)。
K-Means据类的步骤:
确定所有聚类变量(聚类因子);
数据预处理(分类变量数值化、处理缺失值、分析是否存在共线性等,若只有两个变量共线则用比值法,较多变量共线用主成分分析进行降维);
确定聚类个数并用处理后的聚类因子进行聚类分析(若未说明则需要尝试不同的聚类个数[3,4,5,6,7],从中选择平均轮廓系数较大且结果易于分析解释的模型);
分析聚类效果和聚类结果(类中心点和每个类等);
结合实际情况分析每类的意义等 。
(聚类分析处理共线性时不能直接删除,可用比值替代或主成分分析等来消除共线性)
案例分析:
观察数据类型,检查数据是否具有缺失值。数据类型为数值型,原始数据没有缺失值。我们把数据导入DATAHOOP平台,在展示分析中进行异常值分析。分析结果如下表:
Peak_mins
OffPeak_mins
Weekend_mins
上四分位
1382.1
426.825
74.875
中间值
1030.2
274.05
44.4
下四分位
700.2
154.425
25.05
异常值个数
6
5
5
International_mins
Total_mins
average_mins
上四分位
389.03
1781.3
4.2075
中间值
294.075
1370.85
2.73
下四分位
221.2275
1094.925
2.1
异常值个数
13
11
36
由上面可以得到异常值的个最多的具有36个,在数据总体样本中占比比较大。所以不处理异常值,这些异常值有可能是数据中一些特殊的类。
进行相关系数矩阵分析,分析得到的相关系数矩阵如下:
Peak_mins
OffPeak_mins
Weekend_mins
International_mins
Total_mins
average_mins
Peak_mins
1
0.121
0.1448
0.6915
0.9415
-0.0367
OffPeak_mins
0.121
1
0.0247
0.262
0.4425
0.0094
Weekend_mins
0.1448
0.0247
1
0.1282
0.2006
-0.1066
International_mins
0.6915
0.262
0.1282
1
0.7123
-0.034
Total_mins
0.9415
0.4425
0.2006
0.7123
1
-0.0364
average_mins
-0.0367
0.0094
-0.1066
-0.034
-0.0364
1
观察相关系数矩阵中有一个相关系数为0.9415,该系数比较大。所以我们要处理,我们用比值替换法(把两个变量做比,得到的比值替换其中的一个变量)。我们在数据中重新插入一列为Peak_minsTotal_mins得到他们的变量比值,替换Peak_mins变量。得到新的变量,我们把新的
OffPeak_mins
Weekend_mins
International_mins
Total_mins
average_mins
Peak_mins/Total_mins
OffPeak_mins
1
0.0247
0.262
0.4425
0.0094
-0.4771
Weekend_mins
0.0247
1
0.1282
0.2006
-0.1066
0.0079
International_mins
0.262
0.1282
1
0.7123
-0.034
0.3939
Total_mins
0.4425
0.2006
0.7123
1
-0.0364
0.4492
average_mins
0.0094
-0.1066
-0.034
-0.0364
1
0.0116
Peak_mins/Total_mins
-0.4771
0.
您可能关注的文档
- 3高一历史必修一知识点总结.doc
- 3.货物积载与系固方法辨识.ppt
- 4.2 以礼待人课件.ppt
- 3、仪容礼仪.ppt
- 5. 情绪ABC 心理教案.doc
- 5-2-1优秀童谣推广、传唱方案.doc
- 4e营销.doc
- 4.2 以礼待人 课件 (共26张ppt).ppt
- 4、战略定位分析.ppt
- 5 风险衡量.ppt
- 2024云南红河州金平县发展集团限公司招聘5人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024内蒙古锡林郭勒盟西乌珠穆沁旗林业和草原局招录生态管护员【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024云南省事业单位联考招录【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年湖北孝感市孝南区部分事业单位招聘79人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年四川绵阳事业单位历年【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中铁四局总部部门及直属单位员工公开招聘6人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中铁建电气化局集团南方工程限公司2024届校园招聘【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024云南中冶建设工程限责任公司招聘10人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024中钢集团高校毕业生招聘575人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
- 2024下半年浙江嘉兴南湖区卫生系统招聘事业单位工作人员31人【综合基础知识500题】高频考点模拟试题及参考答案解析.docx
文档评论(0)