通话数据分析—数模.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE  PAGE 21 通话数据分析 摘要 本论文主要是根据题目给出的大量的通信记录数据通过Matlab、Excel、Lindo等工具进行整理分析,从整理的结果中找到需要建立的数学模型。本文中整理出了大量的图表来说明要表达的问题。 问题一主要是通过数据的分析,发现所有主叫者的总通话时间呈现对称分布,联系人数主要集中于2到4人之间,为此我们根据这两组数据进行组合来进行对用户分类。其中总通话时间是小于2100认为较短,大于4900认为较长,位于两者之间认为中等。联系人数是小于等于4人认为较少,大于4人认为较多。为此本该将用户分为六类,但是我们发现其中一组的用户数为零。所以最终将用户分为五类:总通话时间较短,联系人数较少的一组有27个用户;总通话时间中等,联系人数较少的一组有161个用户;总通话时间较长,联系人数较少的一组有51个用户;总通话??间中等,联系人数较多的一组有53个用户;总通话时间较长,联系人数较多的一组有8个用户。另外总通话时间较短,联系人数较多的一组有零个用户。 问题二主要是根据第一问的用户分类结果利用层次分析法对推出的新业务进行分析。利用层次分析法可求出每一项业务与每一类用户的相关度。选择相关度最大的一类用户作为本项业务的首推人群。解题过程中是以亲情号这一业务为例,利用层次分析法选择首推人群。然后又结合着基站数据对模型进行了一些改进。 关键词 通话数据 联系人数 通话时间 层次分析法 Matlab Lindo 覆盖率 问题重述 问题背景 通信技术的不断发展拉近了人与人之间的距离。电话作为主要的通信工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网络对当前的通信设备和业务提出了更高的要求。 如何利用现有的通话记录数据进行概括分析,以便作出合理的决策,进而改善通信设施、拓展新的通信业务,依然是很多通信公司所面临的一个难题。 问题提出 附件给出了一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试完成以下问题。 (1)请根据这些通话记录信息建立数学模型以对用户分类。 (2)如果需要推出一款新的通信业务,如何合理选择部分用户作为首选推广人群。说明你的理由,并撰写一份不超过两页的给公司经理的建议。 (3)该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。 问题分析 附件中给出了大量的通信记录的数据,我们必须首先对这些数据进行整理分析,从中找出各组数据之间存在的直接或间接的关系,进而解决下面的问题。 问题(1)分析 该问题要求通过对通话记录信息来建立数学模型对用户分类,而附件中给出了主叫者、被叫者、通话时长、主叫者所属基站等数据。通过粗略分析应该从主叫者联系的人数或通话次数以及每个主叫者总的通话时间来进行对用户分类。用这两方面的限制条件来对用户综合分类。 问题(2)分析 这一问是针对上面的第一问来提出的。问题要求是需要推出一款新的通信业务,如何合理选择部分用户作为首选推广人群。那么这一人群应该是根据这一业务的适合人群以及用户数量的多少来确定。应该考虑到这一业务的推广空间是否足够大,用户是否足够多。 问题(3)分析 该问是考虑现有的通信设施是否合理。题中给出的关于基站的数据应该作为主要的研究对象。必须考虑基站的使用人数以及使用的总时间,从基站的使用状况以及承受能力等方面考虑。如果不合理,在进行改进的时候也应该从这方面入手,尽量使每个基站使用均衡,避免个别基站使用过少而个别基站使用过多的情况发生。可以对使用较少的并且靠近的基站进行合并,在使用较多的基站附近再增加新的基站来减轻原有基站的工作压力。 基本假设 为了对问题的求解进行一定的简化,不过多的考虑更多的无关紧要的因素,减少不可预知的因素(比如人口的变动、通话不均衡)的影响,我们在本问题的求解中作出如下假设: (1)假设此地300个用户保持不变,即这300个用户不会移出本地,也不会增加新的用户。 (2)假设这300个人10天内的通话记录信息能反映该地区平时通话状况的总体情况。 (3)此地用户打电话的话费标准一样。 (4)每个基站的使用总时长没有超过最大的承受能力。 (5)每个基站的覆盖范围大体上是半径为8Km的圆形区域。 (6)每个基站的实际使用量与其周围的用户数量近似呈正比关系。 (7)假设不考虑近距离间的基站的相互干扰。 符号说明 为了在问题的求解中便于叙述,使用了一些符号,在这里对一些符号进行说明: thcs:每个主叫者在10天内打电话的次数; b:每个主叫者在10天内联系的人数; thsj:每个主叫者在10天内打电话的总的时间; A:打电话的时长较短、联系人数较少的用户群; B:打电话的时长中等、联系人数较少的用户群; C:打电话

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档