- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
                        查看更多
                        
                    
                直线相关与回归       变量间相互关系的密切程度和相关方向的分析称为相关分析;变量间数量上的依存关系的分析称为回归分析(即用回归方程表达变量间的数量关系的分析)。直线相关与回归分别是相关和回归分析中最简单的一种,故也称为简单相关与回归。他是研究两个变量间的相关关系与依存关系的统计方法。  第一节    直线相关     一、直线相关的概念       直线相关(linear correlation)是分析两个变量间是否存在线性相关关系的方法。适用于X与Y服从双变量正态分布的资料,双变量正态分布是指对每个确定的X,Y服从正态分布,且对每个确定的Y,X服从正态分布。直线相关的性质,可以用散点图说明。 例1.10名20岁男青年身高与前臂长测量数据如下:  作散点图观察X与Y之间的关系 。        根据散点图可以粗略的看出两个变量间相关的密切程度和相关方向。可分为以下几种情形:  正相关关系 二、相关系数的意义和计算 1.相关系数的意义 相关系数(correlation coefficient)是描述两个变量间相关关系的密切程度与相关方向的指标。总体相关系数用ρ 表示,样本相关系数用r 表示。? 样本相关系数的计算公式为: 2.相关系数的计算 2) 计算ΣX,ΣY,ΣX2,ΣY2,ΣXY。 三、相关系数的假设检验   前例所得相关系数r = 0.8227,是样本相关系数,由于存在抽样误差,要判断总体X、Y间是否有相关关系,就要对样本相关系数进行检验。相关系数的假设检验有两种方法: 1. t 检验:        以上例所得 r 值,检验20岁男青年身高与前臂长之间是否存在直线相关关系。 设  H0:两变量间无直线相关关系,ρ=0      H1:两变量间有直线相关关系,ρ≠0    α=0.05  第二节    直线回归 一、直线回归(linear regression)的概念       两个变量间的数量关系通常有两种,一种是确定性的关系,如圆周长与圆半径之间的关系,称为函数关系;另一种为非确定性的关系,如前述儿童年龄与体重之间的关系,只能估计出某一年龄儿童的平均体重大约是多少,这种关系即为回归关系。       描述两变量间的回归关系仍是用直线方程,为了区别于一般函数方程,我们将它称为直线回归方程(linear regression equation) 。直线回归方程的一般表达式为    式中     是由自变量 X 推算应变量 Y 的估计值,a、b 是决定直线的两个系数。a 为回归直线在 Y 轴上的截距(intercept),即   X = 0时的 Y 值。a  0表示直线与 Y 轴的交点在原点的上方;a  0,则交点在原点的下方;a = 0,则回归线通过原点。b 为样本回归系数(regression coefficient),即直线的斜率。b 0,表示直线从左下方走向右上方,即 Y 随 X 增大而增大;b 0,表示直线从左上方走向右下方,即 Y 随 X 增大而减小;b = 0,表示直线与 X 轴平行,即 X 与 Y 无直线关系。b 的统计学意义是 X 每变动一个单位,Y 平均变动 b 个单位。 二、直线回归方程的求法       根据数学上的最小二乘法原理,即使直线能满足各实测点至直线的纵向距离的平方和为最小,求解常数项a和回归系数b,其计算公式如下:  例2. 某地一年级12名女大学生的体重与肺活量数据如下,求两变量间的直线回归方程。  (2)求      、    、     、    、及 三、直线回归方程的图示         在自变量X的实测全距范围内任取相距较远且易读取的两X值,代入上式。  四、回归系数的假设检验        求得的回归方程是否成立,即X、Y是否有直线关系,是回归分析要考虑的首要问题。       我们知道即使X、Y的总体回归系数β为零,由于抽样误差,其样本回归系数b也不一定为零。因此需做β是否为零的假设检验,可用方差分析或t检验。         在讲述假设检验之前,先对应变量Y的离均差平方和作一分析。 (1)l yy的分析。         如图 ,P点的纵坐标被回归直线与均数截成三个线段:  上述三个线段的代数和为:     这里的P点是在散点图中任取的一点,若将全部点子都按上法处理,并将等式两端平方后再求和,则有:      上述三个平方和,各有其相应的自由度υ,并有如下的关系:                        υ总=υ回 + υ剩                 υ总 = n - 1 ,υ回  = 1,υ剩 = n –2 式中n为样本例数。 (2)方差分析与t检验的基本思想。     方差分析的基本思想是:将SS总分解为SS回与SS剩两部分,然后按下式计算检验统
                 原创力文档
原创力文档 
                        

文档评论(0)