- 1、本文档共99页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
案例分析---数据挖掘在通信业中的应用
发现之旅(续) 发现之旅(续) (2) 每日时段通话分析 感受通话明细数据的一个好方法是,去分析不同类型的通话。话单类型给本地电话(local)、国内长途电话(也称区域电话,national)、国际电话(international)以及座机到移动电话的通话提供了一个明细分类。什么时候会造成不同类型的通话呢?此外,有些通话的开始时间和结束时间分布在不同的时段,该如何处理? ? 解决方法 解决的方法是,读取通话明细记录,并查阅由收费所呈现话单类型的使用者指定的等级。然后按每天中的各个小时,对收费频带做出直方图。对于时段的划分,此案例以1小时作为区间,并将通话的开始时间和结束时间分布在不同时段的记录在对应的两个时段都累积一次。 发现之旅(续) 结果 图7-10就是结果,该图显示了一天中通话的模式。图中各小时中的通话说明了一些有趣的模式。一般来说,凌晨通话数很少;随着一天时间的流逝,通话数随之明显增加。大约8:00A.M.到11:00A.M.时,或3:00P.M.到7:00P.M.时会有一个有趣的峰值——人们在上班时间段会打电话。 发现之旅(续) 发现之旅(续) 图7-11的结果所示,它显示在一天中,什么时候会产生不同类型的通话。每天的中午会产生峰值,而在凌晨使用量则极低。一天中市话占了主要地位。不过,观察每一天的通话时段分布,我们发现,凌晨很少有市话;而国际长途的通话数非常少以致看不出具体的分布。 发现之旅(续) 发现之旅(续) 因为国际电话通话相当重要,这引出更深一层的问题,例如国际电话通话的平均持续时间以及国家电话打往去处。图7-12显示在一天内,国际电话通通话的持续时间如何显著地变化。最长的通话是在白天期间,最短的则是在夜间。图中显示了打往去处主要是香港。更深一层的研究可以指出,哪些客户对价格敏感……也就是,哪些客户在价格下降时会打电话,商业及普通消费者间的不同使用特点等。 发现之旅(续) 发现之旅(续) (3) 国际长途模式 打往国际的通话的利润率相当高,在电话业务里竞争也相当强。该数据探索仅仅探索出国际长途模式的一些方面,包含一天内国际电话通话的时间长度以及受话地点。 对进一步的分析而言,有许多悬而未决的问题:比如家庭用户与业务客户的模式之间有什么不同?相对于那些不同国家的国际电话业务而言有哪些客户基本上只打到一个国家(或仅打一个号码)?客户的国际电话通话模式如何随着时间而改变?一天之中通话模式如何改变等等。 解决方法 首先,我们能够确定出国际长途,因为这些通话是以00+国家代码/地区号取前缀来开头。 其次,我们能从被叫号码中抽取国家/地区代码(简称国码)并从国码表查阅。 结果 如图7-13显示了家庭用户与业务客户的模式: 发现之旅(续) 图7-13 发现之旅(续) (4) 通话的市场细分 市场细分是对客户的广义分类,这些类别包括了家庭用户、政府账户以及不同界别的业务。 市场细分与客户细分类似,因为销售部门是依照细分的市场而组建起来的。具体来说,分别组建独立的部门专门为家庭用户、政府以及大型业务、小型业务账户提供服务。当然,市场细分也会引发一些有趣的问题:比如,区分后的属于同类型的客户是否彼此类似?不同类型客户的通话模式是什么? 发现之旅(续) 解决方法 关于客户通话明细记录的问题,回答起来十分困难,因为这需要查阅每个电话的客户信息。行销信道(比如家庭用户行销渠道、政企行销渠道 )可从客户层级获得而不是从通话明细记录中。通话明细只包括主叫和被叫号码以及通话时间等:对每一个记录而言,主叫号码需要被市场细分取代,而被叫号码也需要被市场细分取代。这就需要将每个号码的通话明细数据跟客户信息数据做“联合”。 一旦通话明细记录被转成主叫市场细分、受话市场细分,那么从市场细分中得到与通话有关的信息,就是一种将所有按市场细分的数据进行总计的工作了。 ? 结果 如图7-14所示,主叫号码按照客户类型和子类型进行细分: 发现之旅(续) 图7-14 本章小结? 通话明细数据包含了客户通话行为的丰富资信。本案例的目的在于展示一些令人信服的结果: 一个国家中某些地区的客户行为与另外一个地区有所不同。 识别出客户的通话时长和通话时段模式。 居民客户可以通过其电话使用展示他们何时在家。这种模式对客户联络以及客户细分都和重要。 国际电话显示出区域性变化,而且通话的长度可能与通话目的地有相当关联。 模型评估与调整优化(续) 模型评估与调整优化(续) 分类正确率和预测命中率都是描述模型精确度的指标,其中分类正确率是预测正确记录数占总记录数的比值,预测命中率是预测流失中实际流失的比例。召回率是描述模型的普适性的指标,是实际流失中预测正确的比例。在实际模型的应用中,这三项指标实际上决定了决策者是否对特定客户群采取必要措施来降低流失率以及对哪些客户进
文档评论(0)