第14章 相关分析和回归分析.pptVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第14章 相关分析和回归分析

* * 多元回归分析 回归模型和回归方程 复相关与偏相关 整体解释力的统计显著性 虚拟变量 曲线相关 使用回归分析需要注意的事项 * * 回归模型和回归方程 描述应变量y如何依赖于自变量x1,x2,…,xn和误差项的方程称为回归模型 ; 在多元回归模型中参数含义与简单回归模型中的有一些不同。 以二元回归模型为例: 为 的简化。 小数点左边的二位数字为直接关系的变量。第一位代表因变量,第二位表示该系数所代表的自变量;小数右边的是表示不变的变量,称为次级变量。当然随着自变量的增多,小数点右边的数字可以到k-1个(k为自变量个数)。 * * 例如,系数 (简化为 )的意义如下:在所有其他解释变量(如X2)保持不系时,x1每变动一个单位所导致的y的相应变化。 通过这种方法,我们能够把每个解释变量对y的影响分离出来,不受其他解释变量的干扰和影响。所以, 和 的值称为局部回归系数。 * * 复相关与偏相关 n个变量影响一个变量的相关称为复相关,求出的系数,称为复相关系数。 当两个独立变量z1、z2影响一个因变量时, 相关系数的计算式是: Ry.12即为复相关系数(multiple correlation coefficient), 为复关可决系数。 * * 复相关与偏相关 所谓偏相关(partial correlation)是在测定n个独立变量对一个因变量的响时,在排除其他变量的影响后,指定一个独立变量对这个因变量计算得的相关系数,称为偏相关系数,也可称为纯相关系数(net correlation coefficient.)。 不能解释的部分可以用估计标准离差 来表示 ,总差异可以用因变量y的方差来说明 ,即: 。 * * 于是: 公式中的最后一项表明,在考虑了自变量x影响时,因变量y中仍然不能被说明的变化差异与y变动的绝对变化差异之间的比值。 这个比值度量着这两个变量之间的关联度在多大程度上可用于解释因变量y。 * * 整体解释力的统计显著性 F—统计量:被解释的变化与未被解释的变化之比。 解释变量的方差 可以被分解为两部分,部分通过回归值 来解释。一部分通过残差 来解释。 被解释的变化与未被解释的变化的有关表达式简单地等于,总的被解释和未被解释的方差除以各自的自由度(分别是n-k-1)。 * * (一)F—检验 F—检验的统计显著性检验程序: 事先说明假设检验 ; 把计算好的F一统计值与临界值相比,临界值取自在一给定概率水平下F一概率分布的F一统计表。 假设可以表述为: 如果我们拒绝H0,我们就可以断定,在被解释变量和至少一个解释变量之间有显著的关系,回归方程整体来看是显著的。 在只有一个解释变量时的简单回归分析的情形下,整体解释力的F一检验必然相当于单个回归系数 的t-检验。这时,可以看到,F=tl。 (二)F一统计表和F一分布 F一分布的形状如右图。 该分布是不对称的; F值不可能为负 。 分布的实际形状取决于与F一统计量的表达式相应的分子和分母的自由度(分别是K和n-k-1)。 F一统计表中概率值(a)有0.05和0.01两种,对应于相应的自由度,分子和分母分别用v1和V2表示,从1到∞。 如:可以查到,在V1=9和V2=12时,F一统计量的临界值(用Fa表示)在0.05的显著水平下等于2.80,在0.01的显著水平下等于4.39;也就是说,只有5%的可能性得到一个大于2.80的F一统计值,只有1%的可能性超过4.39。 如果计算的F一统计量超过了临界值,我们拒绝零假设,并断定整个回归在统计上是显著的。 * * 概率(a) 普通高等教育“十一五”国家级规划教材 面向21世纪高等学校市场营销专业主干课教材 景奉杰、曾伏娥主编 市场营销调研(第2版) ? 高等教育出版社,2010年1月 第14章 相关分析和回归分析 了解散点图和相关系数的概念 了解等级相关的概念 描述简单线性回归模型 描述多元回归分析模型 了解使用回归分析时应注意的问题 * * * * 开篇案例:数据挖掘在定类变量相关性分析中的应用 数据探索性分析在研究分析中有着巨大的作用,同时在做探索性分析时,相关系数往往是被经常采用的工具用以衡量变量与变量之间的关系,然后决定是否分析这些变量。 相关系数用来描述两个变量或两组变量之间的接近程度的量化指标,有着广泛的应用。

文档评论(0)

xiaolan118 + 关注
实名认证
文档贡献者

你好,我好,大家好!

版权声明书
用户编号:7140162041000002

1亿VIP精品文档

相关文档