第7章_数据挖掘在通信业中应用1220.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅 (1)在通话记录中发现什么? ? 通话时长分析 通话时间长短是客户行为的一个基本面。然而更重要的是,它能告诉我们很多关于数据质量的信息,并给出该数据源是否产生合理价值的提示,某些超短通话是否为骚扰电话?超长电话是否为机器故障所致呢? ? 解决方法 解决的方法就是,产生通话时间的长条图,由于通话时长按照秒进行存储,这样的时间区间太小,因此有太多的数据从而无法看到条形图。本案例首先对时长进行分组,以10分钟作为区间。然后查看时长的分布条形图再分析10分钟及以内和10秒钟及以内的分布情况。在时长分析时,同时探索在每个时长中各种通话类型的比例。 7.1.2.4 发现之旅(续) 结果 本案例的通话时长有96.28%都分布在10分钟及以内,且大部分为市内通话,如图7-7所示。这样的条形图对通话时长的探索还不够具体,故将抽取时长为10分钟及以内的通话数据来观察时长的分布情况,并以1分钟为区间。在10分钟及以内的时长分布条形图中,如图7-8所示,共有19,553,655条通话数据,主要数据分布在3分钟及以内。最后,抽取10秒及以内的数据来观察时长的分布情况,如图7-9所示: 7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅(续) 以10秒为单位的通话时长分布 7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅(续) (2) 每日时段通话分析 感受通话明细数据的一个好方法是,去分析不同类型的通话。话单类型给本地电话(local)、国内长途电话(也称区域电话,national)、国际电话(international)以及座机到移动电话的通话提供了一个明细分类。什么时候会造成不同类型的通话呢?此外,有些通话的开始时间和结束时间分布在不同的时段,该如何处理? ? 解决方法 解决的方法是,读取通话明细记录,并查阅由收费所呈现话单类型的使用者指定的等级。然后按每天中的各个小时,对收费频带做出直方图。对于时段的划分,此案例以1小时作为区间,并将通话的开始时间和结束时间分布在不同时段的记录在对应的两个时段都累积一次。 7.1.2.4 发现之旅(续) 结果 图7-10就是结果,该图显示了一天中通话的模式。图中各小时中的通话说明了一些有趣的模式。一般来说,凌晨通话数很少;随着一天时间的流逝,通话数随之明显增加。大约8:00A.M.到11:00A.M.时,或3:00P.M.到7:00P.M.时会有一个有趣的峰值——人们在上班时间段会打电话。 7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅(续) 图7-11的结果所示,它显示在一天中,什么时候会产生不同类型的通话。每天的中午会产生峰值,而在凌晨使用量则极低。一天中市话占了主要地位。不过,观察每一天的通话时段分布,我们发现,凌晨很少有市话;而国际长途的通话数非常少以致看不出具体的分布。 7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅(续) 因为国际电话通话相当重要,这引出更深一层的问题,例如国际电话通话的平均持续时间以及国家电话打往去处。图7-12显示在一天内,国际电话通通话的持续时间如何显著地变化。最长的通话是在白天期间,最短的则是在夜间。图中显示了打往去处主要是香港。更深一层的研究可以指出,哪些客户对价格敏感……也就是,哪些客户在价格下降时会打电话,商业及普通消费者间的不同使用特点等。 7.1.2.4 发现之旅(续) 7.1.2.4 发现之旅(续) (3) 国际长途模式 打往国际的通话的利润率相当高,在电话业务里竞争也相当强。该数据探索仅仅探索出国际长途模式的一些方面,包含一天内国际电话通话的时间长度以及受话地点。 对进一步的分析而言,有许多悬而未决的问题:比如家庭用户与业务客户的模式之间有什么不同?相对于那些不同国家的国际电话业务而言有哪些客户基本上只打到一个国家(或仅打一个号码)?客户的国际电话通话模式如何随着时间而改变?一天之中通话模式如何改变等等。 解决方法 首先,我们能够确定出国际长途,因为这些通话是以00+国家代码/地区号取前缀来开头。 其次,我们能从被叫号码中抽取国家/地区代码(简称国码)并从国码表查阅。 结果 如图7-13显示了家庭用户与业务客户的模式: 7.1.2.4 发现之旅(续) 图7-13 7.1.2.4 发现之旅(续) (4) 通话的市场细分 市场细分是对客户的广义分类,这些类别包括了家庭用户、政府账户以及不同界别的业务。 市场细分与客户细分类似,因为销售部门是依照细分的市场而组建起来的。具体来说,分别组建独立的部门专门为家庭用户、政府以及大型业务、小型业务账户提供服务。当然,市场细分也会引发一些有趣的问题:比如,区分后的属于同类型的客户是否彼此类似?不同类型客户的通话模式是什么? 7

文档评论(0)

baihuamei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档