- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
客户价值分析
RFM模型构建报告
01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS
业务背景当前经济环境下,生猪价格持续低位徘徊,养殖业亏损现象普遍,屠宰行业利润大幅下滑;我司作为大型屠宰加工企业,利润同比去年下滑超50%(个人保守估计),企业该如何度过生猪价格寒冬?控制企业成本势在必行。营销成本作为企业成本的重要一环,当前我司的营销政策存在“一刀切”、涵盖面广、针对性不强等弊端,为避免当前这种情况,我们需对公司现有客户的价值属性进行类别划分,针对不同群体的客户制定差异化的营销策略,提高营销成本的效果转化率,从而达到控制成本的目的。客户划分全量客户客户群A客户群B……..……..客户价值不同群体营销策略A营销策略B……..不同营销策略
建模目的截止目前关于用户价值划分的方法有许多种,其中RFM模型是被广泛因其良好的价值区分性能而被广泛应用,RFM模型是指考虑以下三个客户行为特征:利用这三个特征进行聚类从而将客户划分为不同的类别。考虑到客户提货趋势变化、合作时长等因素均会对客户价值产生影响后,我们决定增加客户提货趋势变化指标和客户建档时长指标放入RFM模型。我们最终的目的是通过这5个字段建立聚类模型从而将客户进行价值划分。R(Recency)最近一次提货F(Frequency)提货频率M(Monetary)提货金额T(Trend)提货趋势L(Length)建档时长RFM模型
01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS
数据准备数据来源来源表表释义取数字段字段释义表用途XYAPP.ST_SALE_X_DETAIL_DAY销售明细表SOLD_TO_PARTY_CODE||ST_DATE||SALE_AMT送达方编码||日期||销售额汇总取数XYAPP.ST_CUST_STATE_INFO新增客户信息表CUSTOMER_ID||CREATE_DATE客户编码||建档时间剔除在统计口径内的新增用户统计口径考虑到数据完整性及时效性,我们选取2018.01-2018.06共计6个月数据作为历史样本数据的统计口径。数据提取字段提取代码见附件一:附件一Tips:趋势指标:二季度销售额比例-一季度销售额比例建档时长:统计截止日期–建档日期
数据清洗数据汇总处理缺失值处理异常值处理数据变换月销量缺失情况以0替换1月销量为负值的记录以0替换;计算频次时剔除销售额负值记录销售额跨度过大,取对数处理1243将5个特征字段利用用户编码汇总数据清洗过程建模宽表因数据量不大,在excel完成数据清洗过程,最终得到建模所需数据宽表(共2501条样本记录)。
01业务背景和建模目的02数据准备和数据清洗03建立模型和效果评估04问题总结和未来展望目录CONTENTS
模型建立(一)RFM模型聚类算法采用的是K-means算法,K-means算法是一种最为常见的聚类算法。K-means算法流程1.确定聚类数m2.随机选取m个初始聚类中心3.计算各样本到各聚类中心距离,将样本划分为距离最近的类4.计算新类的聚类中心(质心)5.对比初始聚类中心是否收敛否结束是模型构建将建模宽表数据读入spssmoleder,选取K-means模型,选取五个特征变量作为输入变量,聚类参数默认数为5,最大迭代次数默认为20,建立聚类模型。
模型建立(二)初步建模效果评估聚类模型效果的评估我们主要看轮廓系数和迭代次数两个指标,初次建模的轮廓系数约为0.45,迭代至20次仍未收敛。对于聚类模型而言,轮廓系数越接近1说明模型效果越好,迭代收敛的速度越快说明聚类结果更为可信。轮廓系数:1、将样本i与簇内的其他点之间的平均距离作为簇内的内聚度a(i);2、将样本i与最近簇中所有点之间的平均距离看作是与最近簇的分离度b(i);3、样本i的轮廓系数s(i)计算公式:4、取全部样本点的轮廓系数取均值作为聚类模型的轮廓系数;下
模型建立(三)模型优化因我们采用了默认的聚类数5和全部五个特征作为输入变量,可以通过选取不同的聚类数(3-7较为合适)和不同的特征变量组合来优化模型。通过上述优化方法最终我们剔除了5个输入变量中的《建档时长》变量,选取聚类参数4作为最终的模型结果(轮廓系数0.62,迭代12次收敛)。模型效果较好,聚类目的基本达成。
效果评估(一)数据聚类结果聚类中心分布聚类-1聚类-2聚类-3聚类-4趋势指标-0.13-0.990.82-0.36提货天数136.557.211.3133.68提货间
您可能关注的文档
最近下载
- 地铁车站智能建筑(弱电)专项施工方案.docx
- 佳能50d使用说明书.pdf
- 食品配送流程(学校食材配送项目).pdf VIP
- GB/T 3480.5-2008_直齿轮和斜齿轮承载能力计算 第5部分:材料的强度和质量.pdf
- 个体工商户转换为企业法人决定书.docx
- 《管理会计师中级案例分析:成本管理的具体运用分析案例》6000字.docx
- 部编人教版初中八年级上册道德与法治《第六课责任与角色同在:做负责任的人》优质课获奖教案_1.pdf VIP
- 2024年疾控大学习我国传染病流行形势与防控策略答案.docx VIP
- 幼儿园课堂设计: 儿童哲学,让幼儿思考哲学问题并进行相关讨论的课堂活动.docx VIP
- 风力机和风力发电技术-控制系统概述.pptx
文档评论(0)