云开发平台下校友数据管理系统设计与实现.docVIP

下载本文档

1
0
约5.37千字
约 13页
2018-08-15 发布于福建
举报
版权申诉

云开发平台下校友数据管理系统设计与实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

云开发平台下校友数据管理系统设计与实现

云开发平台下校友数据管理系统的设计与实现　　摘要最大程度方便客户，提升客户忠诚度，锁定加油卡消费群体，提高零售市场竞争力，是石化销售公司在加油卡营销上的理念。有效地减少客户流失，成为目前各个石油销售公司急需解决的难题。本文研究，基于决策树模型，根据加油卡客户的最近6个月交易数据，建立一种加油卡客户流失预测模型，采用随机森林算法，从而较好地预测了客户流失情况。　　【关键词】加油卡客户流失预测模型决策树模型随机森林算法　　加油卡是用来为汽车加油的储值卡，有极高的便利性，并且针对不同品牌的加油卡有不同种的优惠措施。因为为客户提供更优质的服务取得了突破性进展，“刷卡加油”引领成品油零售市场新潮流，得到了广大消费者的普遍认同。以中石化加油卡为例，从中石化加油卡从2004年正式上线以后，截至2014年5月，累计发行发卡突破1.18亿张，加油卡网络覆盖包括西藏在内的31个省级单位的2.5万个加油站，在1亿多张加油卡中，活跃的会员用户大约有8000万，已然在国内形成巨大规模的商业应用预付费卡体系。　　众多加油卡客户，是石化销售公司的宝贵资源。加油卡的推广提升了企业品牌形象，在维系客户、稳固市场、增加沉淀资金等方面产生了积极作用。　　中国石化销售行业经过高速发展，随着行业内竞争加剧，各石化销售公司加油卡客户的增长逐渐放慢，客户呈现出动态亦增亦减趋势。　　（1）在每个月都有客户新开卡的情况下，也有大量客户停止使用。　　（2）每个月都出现“零充值”、“零消费”客户，大量占用客户维护的信息资源。客户数量的增加不能带来收入的增加，而发展新客户的成本要远远大约挽留老客户的成本。因此，客户流失分析的重要意义对石化销售公司来说不言而喻。　　1 问题理解　　客户流失本质是一种分类问题，即将现有客户分为两类：有流失倾向的客户和无流失倾向的客户。按照一般分类问题的解决思路，首先要选取与流失率可能相关的因素变量，分析这些变量与流失率之间的关系，筛选出合适的变量。为了模型的可解释性，在流失预测中一般采用决策树模型，再根据模型测试结果进行参数调优。　　需要注意的是，客户流失率相对于一般的分类而言不会太高，一般会在20%以下，这样就导致样本中的流失客户占比非常低，需要分类模型能够区分这些小比例的数据。　　另外，石化销售公司往往关注的重点是流失部分客户的预测，也就是偏向于召回率，而不是仅仅准确率。　　2 评价分类质量：召回率和准确率　　召回率（Recall Rate，也称查全率）和准确率（Accuracy，也称查准率）是广泛用于信息检索和统计学分类领域的两个度量值，用来评价结果的质量，如图1。　　TP――True Positive（真正）被模型预测为正的正样本；可以称作判断为真的正确率；　　TN――True Negative（真负）被模型预测为负的负样本；可以称作判断为假的正确率；　　FP――False Positive（假正）被模型预测为正的负样本；可以称作误报率；　　FN――False Negative（假负）被模型预测为负的正样本；可以称作漏报率。　　预测召回率是实际流失中预测正确的比例，体现了模型预测结果的覆盖程度。召回率（Recall Rate）计算方法：　　召回率= 　　= （1）　　预测准确率是预测流失中实际流失的比例，体现了模型对流失客户的预测是否精确。准确率（Accuracy）计算方法：　　准确率= 　　= （2）　　对于一个分类系统来讲，召回率和准确率不可能两全其美：召回率高时，准确率低，准确率高时，召回率低。“召回率”与“准确率”虽然没有必然的关系，然而在大规模数据集合中，这两个指标却是相互制约的。凡是设计到大规模数据集合的分类，都涉及到“召回率”和“准确率”这两个指标。而由于两个指标相互制约，我们通常也会根据需要为“分类策略”选择一个合适的度，不能太严格也不能太松，寻求在召回率和准确率中间的一个平衡点。　　3 决策树和随机森林算法　　决策树（Decision Tree，也称判定树）是一树状结构，它的每一个树节点可以是叶节点，对应着某一类，也可以对应着一个划分，将该节点对应的样本集划分成若干个子集，每个子集对应一个节点。从决策树的根节点到叶节点的一条路径就形成了对相应对象的类别预测。决策树学习着眼于从一组无次序、无规则的事例中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式，在决策树的内部节点间进行属性的比较，并根据不同属性判断从该节点向下的分支，在决策树叶节点得到结论。　　ID3算法是决策树算法的一种。ID3算法是由Quinlan首先提出的。该算法是以信息论为基础，以信息熵和信息增益度为衡量标准，从而实现对数据的归纳分类。