- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
8南宁职业技术学
院
NCVTNANNINGCOLLEGEFORVOCATIONALTECHNOLOGY
厨
数据挖掘与机器学习
DATAMININGA°NDMACHINELEARNING
构建电信运营商用户流失预测模型
电信运营商用户分析
任务描述构建电信运营商用户流失预测模型
电信企业为了最大程度地控制客户流失、挽留现存在网用户,分析不同群体用户的使用规
律,识别各群体客户流失的重要特征。
为了系统地描述电信运营商用户流失的规律,引入数学模型对电信运营商用户数据进行分
析。运营商要实现控制客户流失、挽留现存在网用户,必须深入贯彻以人民为中心的发展
思想。
本任务的具体目标是基于电信运营商用户分群模型建立逻辑回归模型、决策树模型和朴素
贝叶斯模型,选取最优的用户流失模型。
构建电信运营商用户流失预测模型
任务要求
分析不同群体用户的使用规律,识别各群体客户流失的重要特征。
建立不同群体用户流失模型,建立逻辑回归模型、决策树模型和朴
素贝叶斯模型,判断模型建立的效果。
选取最优的用户流失模型。
构建电信运营商用户流失预测模型
相关知识
所有与消费者挂钩行业都会关注客户流失。
由于发展一个新客户是需要一定成本的,如果客户流失,不仅浪费了拉新成本,
还需要花费更多的用户召回成本。
因此,基于电信行业在竞争日益激烈的情况,如何挽留更多用户成为一项关键
业务指标。
为了更好运营用户,这就要求要了解流失用户的特征,分析流失原因,预测用
户流失,确定挽留目标用户并制定有效方案,提升企业核心竞争力。
Part2任务实施
·特征值提取
·构建电信商用户流失预测模型
构建电信运营商用户流失预测模型
特征值提取
基于树的特1.导入开发
特征变量选取
征选择库
基于树的特征选择构建电信运营商用户流失预测模型
特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高
过数据挖掘算法本身。
只有先把现实用特征表示出来,才能借助数据挖掘的力量找到问题的答案。
特征选择的另一个优点在于:降低真实世界的复杂度,模型比现实更容易操纵。
特征选择能够降低复杂度、降低噪音和增加模型可读性。
基于树的特征选择构建电信运营商用户流失预测模型
单个特征和某一类别之间相关性的计算方法有很多,比较有效的有卡方检验(chi2)以
及互信息和信息熵,本文选择基于信息熵的方法来选取特征变量。
信息熵是在决策树中广泛使用的一个变量,用以获取最优划分的节点。
基于树的预测模型能够用来计算特征的重要程度,能用来去除不相关的特征。因此选择
基于树的特征选择(Tree-basedfeatureselection)来获取特征变量。
构建电信运营商用户流失预测模型
导入开发库
使用from和import导入sklearn.ensemble
您可能关注的文档
- 《汽车节能与新能源技术应用》高职PPT完整全套教学课件.pptx
- 《嵌入式系统原理与开发》课件_第5章.pptx
- 《数据挖掘与机器学习》 课件 项目二 农产品信息可视化分析——NumPy、pandas 与 Matplotlib 库.pptx
- 《数据挖掘与机器学习》 课件 项目七 新闻文本分析——聚类.pptx
- 《数据挖掘与机器学习》 课件 项目三 建筑工程混凝土抗压强度检测——线性回归.pptx
- 《数据挖掘与机器学习》 课件 项目四 电商平台运输行为预测——逻辑回归.pptx
- 《数据挖掘与机器学习》 课件 项目五 加工厂玻璃类别识别——决策树、随机森林.pptx
- 《数据挖掘与机器学习》 课件 项目一 搭建数据挖掘与机器学习编程环境.pptx
- 《数据挖掘与机器学习》 课件2.2.2 pandas数据结构.pptx
- 《数据挖掘与机器学习》 课件2.2.3 数据清洗.pptx
- (6.5.4)--污水泵站集水池有效容积的分析与探讨.pdf
- (4.3.2)--基于雨水径流浅表控制的规划研究.pdf
- (8.11.3)--超高盐度对耐盐活性污泥脱氮...微生物活性和群落结构的影响.pdf
- (4.3.7)--生物滞留池对雨水径流控制效果研究.pdf
- (6.5.17)--特大型污水泵站设计要点及经验小结.pdf
- (8.11.1)--GQDs对厌氧颗粒污泥与活性污泥特性的影响.pdf
- (4.3.6)--典型屋面初期雨水径流污染特征及生物控制中试研究.pdf
- (8.11.9)--活性污泥反硝化速率与功能基因活性关联分析.pdf
- (2.3.6)--城镇污水管道系统甲烷产排特性及发生机制.pdf
- (7.7.4)--曝气沉砂池臭气闭路循环“趋零排放”升级改造.pdf
最近下载
- 党员领导干部2024年度民主生活会个人对照检查材料.docx VIP
- 新改版苏教版六年级下册科学全册知识点.doc
- 建设单位管理指南.ppt VIP
- 人力资源管理诊断告及建议.ppt
- 新闻采访与写作.ppt VIP
- 项目1 1.1 植物生产与环境概述(1)(课件)- 《植物生产与环境》(高教版第四版)同步精品课堂.pptx
- (人教2024版)英语七年级下册全册单元知识点讲解+思维导图(新教材).docx
- 2025年临床医师定期考核试题中医知识题库及答案(共300题).doc
- 学校校长2023年度生活会个人对照检查材料.doc VIP
- 2024-2025年度民主生活个人“四个带头”检查发言材料八篇.docx VIP
文档评论(0)