埃森哲的数据挖掘介绍.ppt

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
埃森哲的数据挖掘介绍

Copyright ? 2007 Accenture All Rights Reserved. 子目录 模型的分类与适用范围 模型的评价标准与方法 案例 数据挖掘模型按照功能划分主要分为描述性模型和预测性模型两类 电信行业中最常用的两种数据挖掘模型是客户分群和预测模型 电信业数据挖掘模型主要适用范围 无指导性分群定义 指导性分群定义 指导性分群和无指导分群的主要区别——问题 指导性分群1 指导性分群2 无指导性分群 客户分群常见维度 行为和价值是最能反映客户态度和需求的两个维度 预测模型定义 预测模型是通过对过去数据学习来判断未来某种行为或计量的数学模型,模型目标可以是逻辑型或连续性变量,模型可以简单的用数学公式Y=F(X)来描述预测模型(X是n元向量)。每个客户都将通过模型计算获得一个预测值作为业务决策依据之一。 电信行业中最为广泛使用的预测模型通常是二元逻辑变量预测模型,如客户离网挽留模型、营销活动相应模型等 预测模型的建立方法 子目录 模型的分类与适用范围 模型的评价标准与方法 案例 分群模型评估标准 互斥性和穷尽性原则 (Mutually exclusive Collectively exhaustive) 所有的客户都应该包含在分群模型当中 单个的客户和客户群必须一一对应 可管理性 客户群个数要适中,便于从业务上加以管理。一般的规则是在5~9个群之间选择 具有业务可操作性 客户群应该能够从业务上得到合理的解释 客户群特征应明晰,便于从业务的角度制定客户战略和相应的营销计划 群大小合理 群大小分布合理 非指导性分群的群大小之间差异不能太大 指导性分群的目标比重应差异比较明显 分群有效性示例——群大小和群目标密度分布 模型中客户群选择示例——没有最好,只有最适合 预测模型评估标准 模型信息可解释性 模型信息丰富度。丰富度越高,模型越好 模型主要变量从业务上解释与目标变量的相关性,相关性越高,模型越好 模型预测准确性 对客户用模型预测出的概率进行排序,前xx%(根据实际需求确定,通常为10%)的客户中实际预测准确的客户数越多,模型越好 模型应用强壮性 将模型应用到有相同结构的数据集得到的预测结果越接近,模型的应用强壮性越好,模型就越好 预测模型核心评估图 模型可解释性示例 流失模型一关键变量 IP长途mou IP长途mou占总mou百分比 传统长途mou 传统长途占总mou百分比 省内漫游mou 省内漫游mou占总mou百分比 国内漫游MOU 国内漫游mou占总mou百分比 港澳台漫游mou 港澳台漫游mou占总mou百分比 国际漫游(包全部,包港澳台) 国际漫游(包全部,包港澳台)占总mou百分比 漫游(省内+国内+国际)呼出次数 漫游呼出占总呼出次数的百分比 漫游(省内+国内+国际)呼入次数 漫游呼入占总呼入次数的百分比 移动运营商的平均mou(网内+联通) …… 模型可解释性示例 模型预测准确性示例 模型预测强壮性示例 子目录 模型的分类与适用范围 模型的评价标准与方法 案例 广州移动神州行客户流失管理 亚洲某移动运营商客户流失管理 由此,我们给出如下的预离客户定义,并将离网管理的重点放在防止使用期客户进入预离状态上 对于神州行各品牌,根据四个重要维度对使用期客户其做初步分析,以形成具体的建模策略 从ARPU、在网时长、入网区域及通话类型四个维度分析形成0月租卡的建模策略:连续沉默客户(至少在最近两个月无语音通话)和非连续沉默客户分别建立模型 0月租卡客户中高端客户数比例较低,ARPU 大于50元的客户预离率差别不大,为5%左右,ARPU低于50元的客户预离率较高,为9% 在网时长小于1年的客户和大于一年的客户的预离率比较接近,都在7%左右 各地区客户预离率差异不大,广州中预离率稍微较低 0月租卡中有80多万至少在最近两个月(6,7月)沉默(无语音通话)的客户,占据了神州行全部沉默客户的88%,且此类客户预离率为28% 综合大众卡分析结果,形成大众卡离网预测建模策略: 对在网时长小于等于1年的客户和大于1年的客户分别建立模型 大众卡客户中高端客户数比例较大,低端客户预离率高于中高端客户 大众卡在网时长小于1年的客户预离率大于7%,大于一年的客户预离率为2%左右 各地区客户预离率差异不大,广州中和广州西地区预离率稍微较低 最后一个月没有通话的大众卡客户流失风险较高,但大众卡客户极少在某月中有0次通话 综合畅听卡分析结果,形成畅听卡离网预测建模策略: 对在网时长小于等于3个月的客户和大于3个月的客户分别建立模型 畅听卡主要是中低端客户,低端客户预离率高于中高端客户 有一半客户为入网时间小于等于3个月的新客户;新客户的预离率很高,

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档