流失预测模型设计与实现.docVIP

下载本文档

4
0
约3.6千字
约 8页
2018-11-03 发布于福建
举报
版权申诉

流失预测模型设计与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

流失预测模型设计与实现

流失预测模型设计与实现　　【摘要】随着市场竞争的日益加剧，客户流失问题是电信运营商都面临并急需解决的问题。要解决这个问题，首先就要对客户进行分析和预测。本文就是介绍利用挖掘软件SPASS Modeler对电信客户进行数据探测与分析，掌握老客户的流失动向，并对流失客户的特征进行归类，为以后电信运营提供有用的数据。　　【关键词】客户；SPASS Modeler数据；流失　　Design and Implementation of Churn Prediction Model 　　Lin Kuan-sheng 　　（State Press and Publication Administration of Radiostation2022 XinjiangKashgar 844000）　　【 Abstract 】 With the increasing competition in the market， customer churn problem is and telecom operators are facing urgent problems. To solve this problem， we must first analyze and predict customer， this article is to introduce the use of mining software for telecom customers SPASS Modeler data acquisition and analysis of trends in the loss of control and old customers， and the loss of customer characteristics are classified as after telecom operators to provide useful data. 　　【 Keywords 】 customers；spass modeler data； outflow 　　1 引言　　在电信行业，每个电信运营商都存在客户流失的问题。通常情况下，获取一个新客户的成本往往远高于维系一个老客户的成本，尤其是客户新增市场越来越稀疏的情况下，减少客户流失就意味着用更少的成本减少利润的流失。如何在海量的数据中提取有效的信息，判断用户流失的倾向，从而做到及时、有效地成功维系和挽留老用户成为电信运营商急需解决的问题。为此，本文利用SPASS Modeler数据挖掘工具，进行数据探索，预测在未来一段时间内可能流失的客户，为挽留客户提供明细清单。　　SPASS Modeler数据挖掘的工作流程一般采用CRISP-DM（即“跨行业数据挖掘标准流程”的英文缩写）方法，CRISP-DM是一种业界认可的用于指导数据挖掘工作的方法。具体实施步骤包含商业理解、数据理解、数据准备、建立模型、评估模型、结果部署。　　2 数据处理　　2.1 商业理解　　客户流失属于数据挖掘中的分类技术问题，其最终目的是把客户分为两类：一类是具有流失倾向的客户；另一类是无流失倾向的客户。　　根据对历史流失客户的探讨、分???，总结出具有十分明确的流失客户。以此为依托，提取影响客户流失的动态变量因素和静态变量因素。　　2.2 数据理解　　模型利用SPASS Modeler的统计节点、均值节点、特征节点、直方图、分布图等节点初步确定影响客户流失的变量。　　2.3 数据准备　　数据准备包含数据选择、分析数据。清洗、缺失值和离群值的处理以及相应的数据转化、离散化、抽样、平衡等。　　数据选择是数据挖掘的前提条件，主要是确定模型的输入变量。因为并不是所有的客户信息都会对客户的流失产生影响，应尽可能降低数据的复杂度，发掘较高关联度的输入变量。利用SPASS Modeler的过滤节点过滤所有与流失模型无关的变量。　　分析数据包括数据清洗、预处理。主要包括数据抽样、数据转化、缺损、离群值数据处理等，通过抽样节点，完成数据抽样，通过数据抽样降低系统的处理量。　　数据转化为了保证数据的质量和可用性。比如对连续型数据变量的离散化、数据变形。例如通话次数，数值分布区间范围非常大，而客户分布又比较集中在中低值范围内，数据的极值标准化，有进一步压缩了数据的聚集。对模型的识别的效果不理想，因此可以采用数据转化的方法，使数据分布更好地接近正态分布，即使最终到不到正态分布，但也使数据分布离散化，同时也能消弱极值的影响。　　数据审核节点处理缺失值和离群值，根据实际情况可以选择丢弃、转化等操作。　　3G客户流失率一般在5%左右，如果直接采用决策树、神经网