通话数据分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
通话数据分析

通话数据分析 摘要 本文是对通信领域中用户分类的研究。在通信行业中对客户通话行为分类属于数据挖掘的范畴。我们运用了统计数据分析中的两步聚类分析法、快速聚类分析法对数据进行分类分析,并建立优化模型,以及基站使用率模型进行分析。得出了关于人群的分类信息和基站的建设优化信息。 问题一 首先通过运用SPSS和excel等计算工具,对所给的数据做统计分析,得出了该通信公司的每位客户在10天内的主叫总次数、主叫总通话时间、被叫总次数、被叫总通话时间以及被叫与主叫之比等关系,通过分析,采用聚类分析方法中的距离准则法(平方欧式距离公式)建立模型。从运营商的角度来说,在针对不同客户群推出不同优惠资费套餐的同时要保证或提高运营商的商业收益。 30 11 28 29 基站使用率 0.133 0.138 0.128 0.162 添加基站个数 2 2 2 3 新添加基站 所在区域 30 11 28 29 关键词 图标模型 两步聚类 优化模型 快速聚类 基站使用率 一、问题的重述 通信技术的不断发展拉近了人与人之间的距离。电话作为主要的通信工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网络对当前的通信设备和业务提出了更高的要求。如何利用现有的通话记录数据进行概括分析,以便做出合理的决策,进而改善通信设施、拓展新的通信业务,依然是很多通信公司所面临的一个难题,根据一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试完成以下问题。 请根据这些通话记录信息建立数学模型以对用户分类。 如果需要推出一款新的通信业务,如何合理悬着部分用户作为首选推广人群。说明你的理由,并撰写一份不超过两页的给公司经理的建议。 该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。 二、模型的分析 2.1 问题一 模型分析 首先通过运用excel等计算工具,对所给数据的统计分析,得出了该通信公司的每位客户在10天内的主叫总次数、主叫总通话时间、被叫总次数、被叫总通话时间以及被叫与主叫之比等关系,通过分析,采用聚类分析方法中的Q型聚类建立模型,聚类分析发放的基本思想是: 在样品之间定义距离,在变量之间定义相似系数,距离或相似系数代表样品或变量之间的相似程度。按相似程度的大小,将样品(或变量)逐一归类,关系密切的聚类到一个小的分类单位,然后逐步扩大,使得关系疏远的聚合到一个大的分类单位,直到所有的样品(或变量)都聚集完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品(或变量)进行分类。 在本文中,即将客户看做样本,取其主叫总通话时间长、被叫总通话时间、被叫与主叫之比以及主叫被叫总次数为变量(因主叫次数、主叫平均通话时间、被叫平均通话时间差异不明显),根据此分类,最后得到的客户组中客户特征相似程度达0.8767。然后运用SPSS计算软件可得到最适合的分组数目以及每组包含的客户数,得到分别以群组一到群组十命名的十种类别,结果详见表一。因此问题一得到合理解决。 2.2 问题二 模型分析 问题二的解决,则需建立在问题一的基础上,需要通过对6000多个通话记录统计分析,则可得出下列有效信息: (1)客户在每天的11:00-24:00这一时间段主叫次数明显多于00:00-11:00这一时间段。 (2)客户通话时间近似服从正态分布,且每次通话时间(主要是主叫通话时间)在3-4分钟内的呼叫次数较多,如下图所示: (3)300个客户中有编号为176和编号为104的两位客户的通话时长记录值为负数,则当做异常数据处理,可忽略,因此总客户人数为298人,总通话记录可定为6219个。 因此模型建立目标为:可根据此规律以针对不同客户群体提供不同资费服务,在以能够满足不同群体对通信服务的多样性需求的同时,最大化通信运营商的利益为目标,建立合理的优化模型,以此推出资费套餐。 2.3问题三 模型分析 针对问题三,对主叫者所属基站进行分类计数统计,得到每个基站的通话处理量,画出统计数据折线图,并依据基站分布图对基站进行分析,得到基站间的分类信息,并得出需要改进的基站类型,然后引入基站使用率,进行改进扩容分折,得到需要新建10个基站对22号30号189号高流量区域进行分流,并新建2个基站,对未覆盖的区域进行进一步的覆盖。 三、基本假设 3.1 假设题中所给数据准确、可靠,且具有代表性。 3.2 假设所有客户均为手机用户,且所有通话记录均为本地通话(不包括港澳台地区),即不包括长途、漫游等通话。 3.3 假设这10天内所有客户的通话记录能在将来一段时间内有效。 3.4假设每个客户每天使用手机通话的频率相同。 3.5 假设该公司主叫通话的收费标准是以中国移动资费标准为依据适当可进行调

文档评论(0)

zhuwenmeijiale + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档