基于数据挖掘的家庭客户识别模型.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于数据挖掘的家庭客户识别模型

基于数据挖掘的家庭客户识别模型研究 1 背景 1.1 现状分析 随着各电信运营商进入全业务运营时代,竞争对手利用其全业务优势,围绕宽带和固定电话推出捆绑服务,利用移动在这两块业务非常薄弱的弱点,实施差异化的竞争战略,积极渗透移动业务,市场竞争日趋激烈。为适应新形势下市场竞争的要求,移动必须积极拓展家庭客户市场,立足于移动通信的先发优势和规模优势,重点发展和推广家庭业务,增加客户对移动业务的粘性。这样不仅能防范个人客户被蚕食的风险,更能在传统语音业务和数据业务基础上取得进一步发展。然而当前移动在拓展家庭市场上存在如下几个问题: 家庭客户的识别缺少依据,缺乏有效的手段来支撑家庭客户的精确营销; 传统的三户模型以单个客户为单位进行管理和分析,但在真实社会中,家庭是组成社会组织的基本单位,当前移动的用户管理模型中尚未以家庭为单位对全量用户进行划分,缺乏对客户的深入理解和通信需求的深度挖掘; 1.2 研究目标及演进 移动对于家庭客户的理解及研究尚处于起步阶段,计划通过以下三个阶段的研究来逐步加深对家庭客户的了解,从而更好地为家庭客户市场的发展提供技术支撑: 第一阶段:建立家庭客户识别模型 通过对家庭客户成员和非家庭客户成员之间的对比分析,找到家庭客户成员之间的一些显著特征,帮助我们更好地了解家庭客户成员之间的通信行为,并利用数据挖掘模型进行分析,从而找到识别家庭客户的一些规律; 第二阶段:利用家庭客户识别模型,对全量用户以家庭为单位进行划分 利用第一阶段得到的成果,识别出浙江移动全量用户中的家庭客户,并将浙江移动的全量用户以家庭为单位进行划分,建立以家庭为单位的客户模型; 第三阶段:以家庭为单位进行分析,深度挖掘家庭客户的潜在需求 根据第二阶段得到的成果,以家庭作为基本研究对象,分析整个家庭的通话行为与消费特征,发掘家庭客户的潜在需求,为家庭客户的营销提供技术支撑; 本文的研究目的是解决第一阶段的问题,即通过数据挖掘的方式识别出存在家庭关系的两个独立的移动用户。 1.3 假设与约定 本文中用到的一些基本假设如下: 本文假设办理了家庭套餐业务的户主和成员之间存在家庭关系; 本文假设家庭成员之间必然存在通信联系,例如电话或者短信,如果家庭成员之间不存在任何通信联系,这种情况不在我们的考虑范围之内; 2 家庭客户识别模型 2.1 数据准备 表1为本模型中使用到的所有输入变量,涉及到语音、短信、终端、小区位置信息等15个指标,除了表中的15个输入变量之外,同时还有一个输出目标变量“是否家庭关系”,我们将同一家庭套餐内的两个成员号码定义为存在家庭关系,将不在同一家庭套餐内且有过通话的两个号码定义为不存在家庭关系,各个变量的角色及数据类型如图1所示。以“是否家庭关系”为目标变量,其它15个变量为输入变量,分别选取杭州地区存在家庭关系和不存在家庭关系的号码对5000个,共10000个样本,最终形成含有号码对,及号码对之间15个统计指标的数据集,数据集的格式如下: {号码A ,号码B,是否家庭关系,指标1,指标2,…,指标15} 图1变量的角色及数值类型配置图 序号 变量名称 备注 1 号码A与号码B夜间通话最为频繁的小区位置信息是否一致 取用户在夜间产生的本地市通话详单,统计用户各小区(CELL_ID)的通话次数,取通话次数占比超过50%的小区,判断两用户的小区是否存在重叠 2 号码A对号码B的闲时通话次数占号码A总闲时通话次数的比例 号码A对号码B的闲时通话次数/号码A总闲时通话次数 3 号码A对号码B的闲时通话时长占号码A总闲时通话时长的比例 号码A对号码B的闲时通话时长/号码A总闲时通话时长 4 号码A对号码B闲时有过通话的天数   5 号码A对号码B的下班高峰时间通话次数占号码A总下班高峰时间通话次数的比例 号码A对号码B在下班高峰的通话次数/号码A总下班高峰通话次数 6 号码A对号码B的下班高峰时间通话时长占号码A总下班高峰时间通话时长的比例 号码A对号码B在下班高峰的通话时长/号码A总下班高峰通话次数 7 号码A对号码B的上班高峰时间通话次数占号码A总上班高峰时间通话次数的比例   8 号码A对号码B的上班高峰时间通话时长占号码A总上班高峰时间通话时长的比例   9 号码A对号码B的午间休息时间通话次数占号码A总午间休息时间通话次数的比例   10 号码A对号码B的午间休息时间通话时长占号码A总午间休息时间通话时长的比例   11 号码A对号码B在周末的通话次数占号码A总周末通话次数的比例 周末:星期六+星期天 12 号码A对号码B的下班高峰时间短信次数占号码A总下班高峰时间短信次数的比例   13 一方漫游一方本地的情况下闲时是否有通话   14 是否属于同一统一支付帐号 号码A和号码B在同一个统一支付

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档