預测营销活动的客户响应.docVIP

下载本文档

7
0
约2.08千字
约 7页
2017-01-18 发布于重庆
举报
版权申诉

預测营销活动的客户响应.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

預测营销活动的客户响应

预测营销活动的客户响应一、二元分类器二、案例分析（1）案例说明（2）构建模型（3）模型预测按照SPSS Clementine应用实例改变一、二元分类器在建模过程中，会遇到一些因变量是类别变量，甚至是二元类别变量，如客户响应情况，只有是、否两个结果；客流流失情况，只有流失与不流失两个情况；拖欠贷款情况，也只有是、否两个情况。对于这种二元变量的建模，数据挖掘提供了很多可以实现的算法，如神经网络、C5.0、CR树、QUEST、CHAID、logit模型等。数据挖掘软件SPSS CLEMENTINE有一个二元分类器节点，他将这些适合因变量是类别变量的算法都集成在一起，从而一步可以创建和评估多个模型，尤其是对于数据挖掘的新手，在不能对对建模节点做专家调优的情况下，尝试多种适用的方法，然后比较各方法的优劣，择优录取最好的模型。二、案例分析（1）案例说明某金融公司有四种销售计划，分别是抵押、汽车贷款、储蓄、退休金，数字代码分别是1、2、3、4。该公司现在有以往的销售记录，记录了向2万多位顾客推销的销售计划（变量为campaign）、该顾客接受与否（变量为response）、以及顾客的个人信息和其他服务信息，如年龄（age）、收入（income）、是否使用金卡（gold_card）等，记录在数据文件pm_customer1_train1.sav中。现在想用二元分类器对这些数据进行建模，并对不同的模型进行比较，选出最优的一个，对新的100为客户进行预测，看某种销售计划下响应的人数，待预测文件在pmtest.sav中。软件实现为SPSS Clementine。（2）构建模型构建一个流，将文件读入数据节点，用类型节点设置个变量类型属性：response变量设置为标志类型、方向为输出，customer_id、campaign、response_date、purchase、purchase_date、product_id、Rowid 和 X_random 尽管数据包含有关四项不同活动的信息，但每一次的分析应集中关注其中一项活动可以使用选择节点实现仅在流中包含这些记录。在专家选项卡上，选择需要的建模模型，这里全部选择。一共10个模型。大约5分钟左右，10个模型的报告出来。判别式、SVM模型需要更多的时间训练数据，这从“构建时间”可以看出，数据较多的时候可以去掉。默认情况下，模型会基于总体精确性排序。根据这一度量，C51 模型的精确性最高，但其他多个模型的精确性与之相差不大。根据这些结果，然后使用整体节点将它们组合到一起。通过结合多个模型的预测，可以避免单个模型的局限性，从而使整体准确性更高。在整体节点中，选择响应作为目标字段，并且确保未选中过滤出整体模型生成的字段。这样就可以将每个单独模型的得分与合并的整体得分进行比较。对于整体方法，选择置信度加权投票。此选项确定如何为每条记录生成一个汇总得分。使用简单投票方式时，若三个模型中有两个模型均预测是，则是将以 2 比 1 的投票结果取胜。在使用置信度加权投票方式的情况下，将基于各预测的置信度值进行加权投票。因此，如果一个预测否的模型的置信度比两个预测是的模型合在一起的置信度还高，则否取胜。由单个“C51”、“CR 树”和“神经网络”模型生成的预测（或得分）将分别添加到名为 $C-response、$R-response 和 $N-response 的字段中。这些字段名称由目标字段的名称和每个模型类型所对应的唯一标准前缀共同确定。当根据训练数据度量时，预测值与实际响应（如原始响应字段中的记录所示）的观测值匹配率分别为 92.86%、92.55% 和 92.18%。由模型整体生成的汇总得分将添加到名为 $XF-response 的字段中，其总体精确性为 92.78%。可以看出，三个模型及合并模型的准确度相差不大，均达到了90%以上，故用四个模型预测，比较预测结果。将待测数据读入SPSS节点，并连接上类型，用表文件查看预测结果。由于上面的建模是针对campaign=2，即汽车贷款计划可接受的情况进行建模，故预测结果为客户对是否接受汽车贷款计划的响应情况。四种模型均显示，100为客户中，编号为#69039的客户对汽车贷款计划会接受，其中C5.1模型显示，编号为#27594的客户对汽车贷款计划也会接受，但其他四个模型预测不接受。用同样方法，对campaign=1的情况进行建模，并分别预测100为客户对这种销售计划的响应情况，结果如下： Campaign=1 C5.1 #27610、#27760、#27865 神经网络无人会响应 CR树 #27610、#27760 整体 #27610