- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 相关与回归分析 第一节 相关关系的概念和种类 一、相关关系的概念 两个或两个以上变量之间的关系可分为两类:函数关系和相关关系。 1. 函数关系 函数关系是一种确定性的关系,它反映着现象之间存在着严密的依存关系,在这种关系中,对于某一变量的一个数值,都有另一变量的确定的值与之对立。例如圆面积与半径的关系,对于任意一个半径值R,必能求得一个唯一的面积值S,两者之间的关系是完全确定的。函数关系不包含误差的干扰。 2.相关关系 是一种非确定性的关系,即一个变量的取值受到另一变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。例如,作物的产量与施肥量的关系,适宜的施肥量下产量较高,施肥量不足则产量较低。但这种关系并不是完全确定的,即使施肥量完全相同,两块同样面积土地上的产量也不会相等。在实验科学中两类变量因受误差的干扰而表现的非确定性的关系为相关关系。 具有相关关系的两个变量,可分别用Y和X表示: 两个变量间的关系若具有原因和反应(结果)的性质,则称这两个变量间存在因果关系,并定义原因变量为自变量,以X表示;定义结果变量为应变量,以Y表示。例如在施肥量和产量的关系中,施肥量是产量变化的原因,是自变量(X);产量是对施肥量的反应,是应变量(Y)。所以相关关系比因果关系的概念要广泛。但在相关关系分析中并没有自变量和应变量之分。 相关关系也包括互为因果关系。例如在身高与体重之间的关系,是同步增长、互有影响的,既不能说身高是体重的原因,也不能说体重决定身高。在这种情况下,X和Y可分别用于表示任一变量。 同时还包括非直接的因果关系。如:哥哥高,妹妹也高,这产生于同一原因,父母亲的身材比较高。 二、相关关系的种类 ㈠按相关关系涉及的变量多少划分分为单相关、复相关和偏相关。 1.单相关:两个变量之间的相关(一元相关)。 2.复相关:当所研究的是一个变量对两个或两个以上其他变量的相关关系时,称为复相关。例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。 3.偏相关:在某一现象与多种现象相关的场合,假定其他变量不变,专门考察其中两个变量的相关关系,称为偏相关。例如,在假定人们的收入水平不变的条件下,某种商品的需求与其价格水平的关系就是一种偏相关。 ㈡根据相关的形式不同划分 ⒈线性相关(直线相关):当一个变量变动时,另一个变量也相应发生大致均等的变动。 ⒉非线性相关(曲线相关):当一个变量变动时,另一个变量也相应发生变动,但这种变动是不均等的。 ㈣根据相关关系的程度来划分 ⒈不相关:两个变量彼此的数量变化互相独立。 ⒉完全相关:一个变量和数量变化由另一个变量的数 量变化所唯一确定。(函数关系) ⒊不完全相关:介于不相关和完全相关之间。 三,相关分析的任务 对现象之间变量关系的研究,统计是从两方面进行的: 一方面是研究变量之间关系的紧密程度,并用相关系数或指数来表示,这种研究称为相关分析。 另一方面是关于自变量和因变量之间的数量变动关系,并用数学方程表达,在统计上称为回归分析。 相关——回归分析的目的是对相关的密切程度和变化的规律性在数量上加以表现,进而得各种推算和预测。 第二节 直线相关系数 一,直线相关系数的计算原理 通过编制相关表和绘制相关图对现象之间的关系有了初步的了解,还需计算相关系数r来分析关系的密切程度。相关系数是说明两个变量之间有无直线相关关系及相关关系密切程度的统计指标。相关系数计算方法有多种,如积差法、等级相关系数、另外还可根据回归方程方差分析来测定相关系数。下面主要介绍积差法相关系数。 积差相关也称积矩相关,是英国统计学家皮尔逊(Pearson)于20世纪提出的一种测量直线相关的基本方法,因而积差法相关系数又称为皮尔逊相关系数。 按“积差法”计算相关系数是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。 其计算公式如下: 积差相关的使用条件: 1.两种变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布; 2.必须是成对的数据,而且每对数据之间是相互独立的; 3.两种变量之间呈线性关系; 4.样本容量n≥30,计算出的积差相关系数才具备有效的意义。 对相关系数基本计算公式的推导: 如果在平面坐标上,以两个变量的平均值 为原点,划分为四个象限,凡落 在第1象限的点, 均为正,所以 亦为正; 凡落在第Ⅲ象限的相关点, 均为负,所以 亦为正。这就说明了,如果相关资
文档评论(0)