- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘应用案例: RFM 模型分析与客户细分
分类: 数据挖掘 | 标签: 市场研究 数据挖掘 RFM 模型
2012-01-21 21:39 阅读 ( 16854 ) 评论 (9)
这里,我先给各位朋友
拜年,祝大家新春快乐!
兔年就要过去了,本命年的最后一天再不更新博客有点对不住大家!正好刚帮某电信
行业完成一个数据挖掘工作,其中的 RFM 模型还是有一定代表性,就再把数据挖掘 RFM
模型的建模思路细节与大家分享一下吧! 手机充值业务是一项主要电信业务形式, 客户的充
值行为记录正好满足 RFM 模型的交易数据要求。
根据美国数据库营销研究所 Arthur Hughes 的研究, 客户数据库 中有三个神奇的要素,
这三个要素构成了数据分析最好 的指标: 最近一次消费 (Recency) 、消费频率 (Frequency) 、
消费金额 (Monetary) 。
我早期两篇博文已详述了 RFM 思想和 IBM Modeler 操作过程,有兴趣的朋友可以阅
读!
RFM 模型: R(Recency) 表示客户最近一次购买的时间有多远, F(Frequency) 表示客
户在最近一段时间内购买的次数, M (Monetary) 表示客户在最近一段时间内购买的金额。
一般原始数据为 3 个字段:客户 ID 、购买时间(日期格式)、购买金额,用数据挖掘软件
处理,加权 (考虑权重)得到 RFM 得分, 进而可以进行客户细分, 客户等级分类, Customer
Level Value 得分排序等,实现数据库营销!
这里
再次借用 @ 数据挖掘与数据分析的 RFM 客户 RFM 分类图。
本次分析用的的软件工具: IBM SPSS Statistics 19 ,IBM SPSS Modeler14.1 ,Tableau7.0 ,
EXCEL 和 PPT
因为 RFM 分析仅是项目的一个小部分分析, 但也面临海量数据的处理能力, 这一点对
计算机的内存和硬盘容量都有要求。
先说说对海量数据挖掘和数据处理的一点体会:(仅指个人电脑操作平台而言)
一般我们拿到的数据都是压缩格式的文本文件,需要解压缩,都在 G 字节以上存储
单位,一般最好在外置电源移动硬盘存储;如果客户不告知,你大概是不知道有多
少记录和字段的;
Modeler 挖掘软件默认安装一般都需要与 C 盘进行数据交换,至少需要 100G 空间
预留,否则读取数据过程中将造成空间不足
海量数据处理要有耐心, 等待 30 分钟以上运行出结果是常有的现象, 特别是在进行
抽样、合并数据、数据重构、神经网络建模过程中,要有韧性,否则差一分钟中断
就悲剧了,呵呵;
数据挖掘的准备阶段和数据预处理时间占整个项目的 70% ,我这里说如果是超大数
据集可能时间要占到 90% 以上。一方面是处理费时,一方面可能就只能这台电脑处
理,不能几台电脑同时操作;
多带来不同,这是我一直强调的体验。所以海量数据需要用到抽样技术,用来查看
数据和预操作,记住:有时候即使样本数据正常
文档评论(0)