- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                第十章  直线回归       和相关分析        英国生物学家高尔顿(Francis Galton,1822—1911)提出“回归”一词。1889年出版的《自然遗传》( Natural inheritance) 一书中首次提出并阐明了“相关”的概念及计算两个变数相关程度的“相关系数”(Correlation)的概念。 第一节  回归和相关意义   一、基本概念  一般变量之间的关系可以分为两类:一类是函数关系,另一类是统计关系。  函数关系是一种确定性的关系,一个变量的取值和变化完全取决于另一个或几个变量的取值和变化。  统计关系是一种非确定性的关系,即一个变量的取值受到另一变量的影响,两者之间既有关系,但又不存在完全确定的函数关系。  对具有统计关系的两个变量的资料进行初步考察的简便而有效的方法,是将这两个变量的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上,获得散点图(scatter diagram)。  根据散点图可初步判定双变量X和Y间的关系,包括: ①X和Y相关的性质(正或负)和密切程度; ②X和Y的关系是直线型的还是非直线型的; ③是否有一些特殊的点表示着其他因素的干扰等。  二、回归分析和相关分析  1.回归分析  对两个变量进行回归分析是定量地研究X和Y的数值变化规律,根据这种规律可由一个变量的变化来估计另一个变量的变化。  在回归模型中,两个变量有因果关系,原因变量称自变量(independent variable) ,一般用X表示;结果变量称依变量(dependent variable),以Y表示。X是已知的或是可控制的,没有误差或误差很小,而Y则不仅随X的变化而变化,还要受到随机误差的影响。  2.相关分析  对两个变量进行相关分析,其目的是研究X和Y间有无相关以及相关程度、相关性质(方向)。 在相关模型中,两个变量是平行的,没有因果关系的自变量和依变量之分,且皆有随机误差。 第二节   直线回归 一、直线回归方程(linear regression equation) 1.直线回归方程与参数估计    上式读作“y依x的直线回归方程”。  x是自变量;     是和x的量相对应的依变量y的点估计值;  a是x=0时的值,即回归直线在y轴上的截距;  b是x每增加一个单位数时,   平均地将要增加(b0时)或减少(b0时)的单位数,叫回归系数。   分别对a和b求偏导数并令其为0,即可获得正规方程组(normal equations):       算得的b、a值带入方程式,即可保证  2.直线回归方程的计算 〔例10.1〕某地一年级12名女大学生的体重与肺活量的关系数据列于表10.1,试求肺活量(L)对体重(kg)的直线回归方程。  表10.1  体重与肺活量关系 散点图 解:首先由表10.1算得回归分析所必须的6个一级数据:      然后,由一级数据算得5个二级数据:     故得表10.1资料的回归方程为:   上述方程中回归系数和回归截距的意义为:当体重(x)每增加1kg时,则肺活量平均增加0.558L;若体重为0,则肺活量为0.0004L。限定x的区间为[42,58];如要在x42或58的区间外延,则必须有新的依据。 3、直线回归方程的图示 4.直线回归的估计标准误 回归方程的估计标准误sy/x为:   恒等式      [例10.2]  试计算由表10.1资料获得的回归方程的估计标准误。 代入(10.5)式有:    它的统计意义是:在                          范围内约有68.27%个观察点,在                        范围内约有95.45%个观察点等。   5.直线回归的数学模型和基本假定 Y总体的每一个值由以下三部分组成:  ①Y的总体平均数 因此,总体直线回归的数学模型可表示为:    其中,  相应的样本线性组成为:  直线回归的基本假定 (1)Y变量是随机变量,而X变量则是没有误差的固定变量,至少和Y变量比较起来X的误差小到可以忽略。 (2)在任一X上都存在着一个Y总体(可称为条件总体),它是作正态分布的,其平均数     是X的线性函数:  (3)所有的Y总体都具有共同的误差方差 这一方差不因X的不同而不同,而直线回归总体具有                  试验所得的一组观察值(xi,yi)只是                 中的一个随机样本。  (4)随机误差相互独立,并作正态分布,具有  二、直线回归的假设检验  1.回归关系的假设检验  (1) t检验       遵循v=n-2的t分布  [例10.3]  试检验例10.1资料回归关系的显著性。      
                 原创力文档
原创力文档 
                        

文档评论(0)