- 1、本文档共1页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Clementine逻辑回归的电信客户分类.pdf
科技信息 0IT技术论坛0 SCmNCETEcHN0L0GYINFORMATION 2008年 第 36期
基于 Clementine逻辑回归的电信客户分类
颜 昌沁 胡建华 周海河
(昆明理工大学信息与 自动化学院 云南 昆明 650051)
摘【 要】本文研究的是电信行业中客户分类的问题,通过调研和开发实践,使用了统计分析和数据挖掘的技术,对电信客户分类主题进行
了较 为完善 、深入的分析 与研 究。使 用大量相关技术和统计 方法,最终确 定了逻辑回归模型作为电信客户分类的预 测模型 ,为 电信经营分析 系
统作 了有益的尝试与探 索
关【键词 】数据挖掘 ;客户分类;统计分析;逻辑回归
一 、 引言 的项 ,以确定能否在不对模型功能造成重大减损的情况下删除其 中任
本文是基于 中国电信某分公司经营分析支撑系统项 日为背景来 何项 。当无法再添加任何项来改进模型、也无法删除任何项而不减损
展开的。客户分类是 电信公司重点关注 的问题 ,不 同类型 的客户带来 模型功能时 .最终模型便 已生成 。选择主效应是 因为用全析 因有可能
的客户价值是不 同的,针对不同类型的客户制定 的服务策略也是不同 出现过度拟合 ,选择分类则可以显示输 出字段预测值和实 际值 的百分
的,所以要求将客户分为不同的类型 ,提高向客户推销产品的成功率 , 比矩阵 。
防范客户流失 本文从时间、地域 、产品类型、在网时长 、用户状态 、消 在生成 的模型 中高级选项卡 E显示 的项 目取决于在建模节 点选
费金额、年龄等角度进行分析,通过构建数据仓库模型得到数据挖掘 中的选项,它显示观测值处理概要 ,落在 目标字段每个类别中正确率
需要的样本集,通过聚类及知识领域的指导来生成关于客户分类的逻 及总的正确率 。如果基于训练数据将所有客户分配到空模型,则得到
辑 回归模型 ,找 出电信客户分类的特征和规律 .来辅助 电信公司制定 的正确率将是29l2%。而在经过模型训练 以后 ,将这些预测与空模型
营销政策。 的结果相 比.分配的正确率提高了3O个百分点,达到 59.4%。可以看
二、研究现状及逻辑回归模型特点 出模型在识别客户类别 1时表现优异 ,正确率达到7O%以上 ,而在识
国内的电信企业 出于市场竞争 的需求 ,大多 已建立或在建 “电信 别客户类别 2时稍有不足。因为公司投资的最高回报来 自于落在类别
经营分析系统”,客观上为深层次 的数据分析提供 了良好 的数据平 台。 1和类别 3中的客户 ,所 以模型的表现 比较令人满意 ,达到 了预期 的
但是在分析及应用开发上 ,大多数 的系统都基于 固定报表、即时查询 目标 。在模型的准确度达到要求以后 ,将生成的模型导入到业务支撑
以及主观探索OLAP基础之上,缺少深层次的数据挖掘。在国外,不少 系统中,在导出模板 中,选择数据库 ,输入服务器地址及数据库名称 ,
知名的电信公司利用数据挖掘技术提升利润空间,通过建立 电信客户 还可在模型里导出PMML及 SQL等。总体挖掘过程和分类准确率情
分类模型,对不 同类型的客户制定不 同的服务策略,提高客户价值。 况如下图所示 :
Clementine是一个数据挖掘工具平台,通过平 台可以采用商业技 ⑩ 一 @ 一⑩ 势擞
术快速建立预测性模型 ,其参照行业标准 CRISP—DM模型设计而成 , … I 攒耩傩
可采用的分类模型包括 :K—Means模型、逻辑 回归模型、判别分析模型 @ 一 档_ 币 r『
等 本文选择的是多项逻辑回归模型来进行 电信 的客户分类 ,它根据 L『2舯l8lj1l8一!L—L…~707一%
输入字段值对记录进行分类 的统计技术 ,类似于线性
文档评论(0)