- 1、本文档共92页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 相关与回归分析 第一节 相关分析 第二节 一元线性回归分析 相关分析和回归分析有什么用? 一个国家香烟的消费量与癌症的发病率有关系吗? 父母的身高是否影响其子女的身高? 公司股票的市盈率与老总的薪酬有关联吗? 接受高学历教育的人是否比低学历的人有更高的薪水?…… 现实世界中存在着大量诸如此类的问题,用统计语言来概况,就是两个或者更多个变量之间,是否存在相互关联?进而,存在相关关系的变量间又是如何相互影响的? 相关分析和回归分析可以用来回答这类问题,它们是研究现象之间相互关系的两种基本方法。本章介绍这两种方法的理论与应用。 6.1 相关分析 客观现象之间的数量依存关系,可以分为: 一种是函数关系; 一种是相关关系。 1)函数关系 是一一对应的确定关系; 当一个或几个变量取一定的值时,另一个变量有确定值与之相对应,我们称这种关系为确定性的函数关系。 可以用数学分析的方法去研究 一般情况下确定性函数关系可表示为 : y = f (x), 其中 x 称为自变量, y 称为因变量 一个自变量,各观测点落在一条线上 2)相关关系(correlation) 当一个或几个相互联系的变量取一定数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。 用相关与回归分析方法研究 这种关系有二个明显特点: 一般可表示为 Y= f(X , u)(u为随机变量) 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 (一个自变量) 函数关系和相关关系,在一定条件下是可以互相转化的 相关分析的作用 特点: 对于特定的总体来说,X和Y的数值是既定的,总体相关系数是客观存在的特定数值。表现为一个常数。 一般不可能直接观测总体的两个变量的全部数值,所以总体相关系数一般是不知道的。 为便于计算,相关系数可用下式计算: 特点: 样本相关系数是根据从总体中抽取的随机样本的观测值计算出来的,是对总体相关系数的估计,它是个随机变量。 为研究美国软饮料公司的广告费用X和销售数量Y的关系,分析7种主要品牌公司的有关数据 (3) 在大多数情况下,X与Y 的样本观测值之间存在着一定的线性关系。即 0|r|1 若 r 0 表明X与Y 为正相关; 若 r 0 表明X与Y 为负相关。 (4)当|r|=1 时,表明X与Y完全线性相关: 若r = 1,称X与Y完全正相关; 若r = -1,称X与Y完全负相关。 一般标准: 0.8 |r| 1 ,表示高度相关; 0.5 |r|≤ 0.8 ,表示中度相关; 0.3 |r|≤ 0.5 ,表示低度相关; 0 |r|≤ 0.3 ,表示相关关系很弱,基本可以认为没有线性相关关系。 相关系数(取值及其意义) 注意:相关关系≠因果关系! 典型的错误推断: 统计分析表明,庆祝生日次数越多的人越长寿。因此,庆祝生日有利于健康。 调查表明,世界各国人均电视机拥有量与预期寿命存在很强的正相关性。因此,电视机拥有量越高,预期寿命越长。 对小学各年级学生的抽样调查表明,学生的识字水平与他们鞋子的尺寸高度正相关。因此,学生穿的鞋越大,他的识字水平就越高。 检验的依据: 如果X和Y都服从正态分布,在总体相关系 数 ρ=0的假设下,与样本相关系数 r 有关的 t 统计量服从自由度为n-2的 t 分布: 显著性水平和拒绝域(双侧检验) 相关系数的检验方法 1)提出原假设和备择假设 H0:ρ=0 (原假设) H1:ρ≠0 (备择假设) 2)计算t 统计量; 3)给定显著性水平α,查自由度为 n-2 的临界值tα/2 ; 4) 若|t|≥tα/2 ,表明相关系数 r 在统计上是显著的,应否 定ρ=0 ,而接受ρ≠0 的假设; 5)反之,若|t|tα/2 ,表明相关系数 r 在统计上是不显著 的,应接受ρ=0 的假设。 例题:某产品广告费用和销售额
文档评论(0)