- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
通话数据的聚类分析问题
摘要
本文是针对通讯公司对其客户的通话记录,按照所给的数据对这些客户进行分类,
并且为提供的新业务推荐首选人群,此外,还考虑该地的基站建设合理性问题,通过分
析提出合理的建议。
对于问题一,对客户分类采用 k-means 聚类分析的方法,首先对客户进行初步分类,
由于 k-means 算法对脏数字很敏感,因此,建立聚类有效性评价模型,根据有效性的两
条指标——类内紧致性和类间的分离度,定义有效评价函数,由此得出最优的分类数为
3,再次对客户进行分类,得到相应的结果。
类别
1
2
3
3,4,6,7,
10,22,25,28,29,31,33,36,39,43,45,46,47, 8,9,
48,50,55,57,58,59,60,62,63,64,65,66,67, 11~24,26,
68,72,73,74,75,76,77,78,80,81,82,83,84, 27,30,32,
85,86,88,89,90,91,95,96,97,98,99,100, 34,35,37,
101,102,104,105,106,107,108,109,110,111, 38,40,41,
113,114,115,116,117,118,119,121~136,139, 42,44,49,
140,141,142,143,144,145,146,147,149,150, 51,52,53,
151,152,153,155,156,157,159,160,161,162, 54,56,61,
用户 163,164,165,166,167,168,169,170,171,173, 69,70,71, 1,2,5
174,175,176,177,178,179,180,181,182,183, 79,87,92,
184,186~238,240,241,242,243,244,245,246, 93,94,
247,248,249,250,252,253,254,255,256,257, 103,112,
258,259,260,261,262,263,264,265,266,267, 120,137,
268,269,270,271,272,273,274,275,276,277, 138,148,
278,279,280,281,282,283,284,285,286,287, 154,158,
288,289,290,291,292,293,294,295,296,297, 172,185,
298,299
239,251,
300
对于问题二,在问题一的基础之上,对已分类的客户的通话特点进行分析,将客户
群划分为三类:优质客户群,潜在客户群和弱势客户群。针对不同的客户群,举例提出
相应的新业务,优先考虑优质客户群,挖掘潜在客户群,调动弱势客户群的积极性。
对于问题三,考虑基站的密集度和通话时间和次数的关系,在密集度较大的地区适
当增加基站数目,通过合理性分析和实际情况分析,得出结论:15 1 27 11 22 28 30 29
基站周围应新设的基站数分别为 2 1 1 6 4 6 7 10。
关键词:k-means 聚类有效性评价 紧致性和分离度 密集度
一、问题重述与分析
通信公司通常根据客户现有的通话记录来制定合理的决策,进而改善通信设施、拓
展新的通信业务,从而获得最大的利润。电信企业一般从三个方面区别于竞争对手并获
得竞争优势:价格、业务和客户服务。随着市场的开放,客户的选择增加,对市场的认
识也加深了,他们更希望作为一个独立的个体被认识和理解,越希望企业更好的理解和
满足他们的需要,为他们提供个性化的服务。因此,建立以客户为中心的营销服务体系
是各企业的必然选择,提供既能留住老客户又能吸引新客户的决策信息则要求企业要实
施客户细分[1]。
问题一要求根据一家通信公司的 2009 年 6 月某地的 300 个用户 10 天内的通话记录
来对用户进行分类。考虑到通信企业营销的最终目的是在成本最低的情况下获得最大的
收益,且用户的主叫和被叫次数,通话时间的长短都会影响到公司的利润。因而用 SPSS
对通话数据进行分析和统计,得到每个用户在十天内被叫者与主叫者次数之比,平均每
天通话的总时间以及平均每天的通话次数。将这三个指标作为划分客户的依据,对 300
个用户进行聚类分析,再从样本之间的紧致度和分离度出发 ,建立聚类有效性评价模型,
对选择的阈值给出有效性评价,从而确定最佳分类,得到合理的分类方案。
问题二要求合理的选择部分用户作为新业务的首推人选。在问题一的基础上,对已
经分好类的用户的通话情况进行分析,对其赋予合理的社会身份,分析适合这类人群的
通信业务,从而将业务和相对应人群一一对号入座。
问题三
原创力文档


文档评论(0)