- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
部分数据分析方法地应用(基于spss)
第二讲:部分数据分析方法的应用(基于spss) 主讲人:邓光耀 1、概述 1.1数据分析的方法多种多样,具体选择哪种方法分析数据,要由数据分析的目的来定。 1.2本讲叙述几种在销售等数据分析中可能用到的方法,如RFM模型、回归分析、相关分析等,这些方法都有一定的适用范围,听者不必拘泥于这些方法。 1.3对于数据分析,自然要有比较深厚的数学功底,但是大家的数学基础有限,因此本讲既有必要节制性地引入数学知识,又不必对数学方法做炫耀性的滥用。 2、RFM模型 2.1对于销售人员,经常会遇到这样的问题:假设你的客户很多,但是由于你本人的精力与成本有限,哪么你应当通过什么样的办法辨别哪些是应当重点处理的客户? 2.2根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency),消费频率(Frequency),消费金额(Monetary)。 2.3例1:我们分析2010.7.1—2010.12.31的交易数据,如下表: 我们先处理最近交易日期的数据,我们按照距2010.12.31日期的远近来划分等级,假设一周之内的数据设为5,如客户3的最近交易日期这分项可以设为5;大于一周且在一个月内的数据设为4,可得到客户6、9的最近交易日期这一分项可设为4;大于一个月且在两个月内设为3,可得客户2、8的最近交易日期这一分项可设为3;大于2个月且在四个月内设为2,可得客户1、5、10的最近交易日期这一分项可设为2;大于四个月且在六个月内设为1,可得客户4、7的最近交易日期这一分项可设为1。这样分类是否合理要由实践验证。 依次分类如下:2,3,5,1,2,4,1,3,4,2. 累计交易次数我们可以简单地按等分的办法分类,即1-3次设为1,4-6次设为2,7-9次设为3,10-12次设为4,13-15次设为5,可依次得到客户的对应数值如下: 1,3,5,1,2,4,1,3,2,2 . 对于交易金额,我们按照所谓的“帕雷托法则”(Pareto’s Law)来分类,即:公司80%的收入来自20%的顾客,不过我们不必拘泥于此法则。 我们先在excel表格中按升序或者降序排列交易金额,再计算占所有客户总金额的累计比例。我们计算可得到: 我们做如下分类:客户3此分项为5,客户2、6此分项为4,客户5、8、10此分项为3,客户1、9此分项为2,客户4、7此分项为1. RFM模型的分类没有统一的分类标准,只能按照实际情况做大概的分类。 我们综合以上步骤,可得到如下表格: 我们对此表格做简单的分析,如果销售人员的精力与成本有限,可以重点考虑满足以下条件的客户: 因为相比于R,F,销售人员可能更看重M(累计金额),故取 另外对总分也有一定的要求,这里我们取 以上分类标准的合理性需要销售人员的实践验证。 另外我们可以对其他指标做类似的分类,对客户群得到更好的管理。 例如送货上门的话,应当考虑运输成本,距离近的客户要优先考虑。运输成本,可以参考河南禹州拉沙车的例子。 大家也可以把此模型中的方法运用到准备考试的时间分配上, 3、回归分析 3.1回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 3.2例2:我们回到第一讲的例子(例5),价格与销售量的关系表: 我们解决以下问题:价格与销售量的函数表达式?并预测单价下降到30时的销售量?销售金额最大化时的价格与销售量分别是多少? 在上一讲中我们得到如下散点图: 我们建立两变量的线性回归模型: 其中 ,即服从期望为0,方差为 的正态分布。利用历史数据,我们可以得到 的值,由于历史数据可能不止两组,由gramer 法则知道(1)式的解可能不存在。数学上认为使得 最小的a,b 的值是最佳估计值。 令 ,我们求它的偏导数,并令它们为零,即 这个方程组称为正规方程组,令 分别为x,y两个变量的样本均值。则有
文档评论(0)