- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章直线回归与相关
西南科技大学生命科学与工程学院周海廷制作 1、函数关系与统计关系 函数关系是一种确定的关系。例如圆面积与半径的关系为: 定义结果变数为依变数(dependent variable),以Y 表示。 如果两个变数并不是原因和结果的关系,而呈现一种共同变化的特点,则称这两个变数间存在相关关系。 相关关系中没有自变数和依变数之分。 3、回归分析和相关分析 (1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y 随X 的改变而改变的方程 ,称之为回归方程(regression equation of Y on X ),这一过程称为回归分析。 称为散点图(scatter diagram)。 8.2.1 直线回归方程 称为直线回归方程(linear regression equation)。其中a 是x=0时的 值,即回归直线在y 轴上的截距,叫回归截距(regression intercept);b 是x 每增加一个单位数时, 平均地将要增加(b0时)或减少(b0时)的单位数,叫回归系数(regression coefficeint)。 从上图得知,要使 能够最好地代表y和x在数量上的互变关系,必须使 分别对a和b求偏导并令其为0,即: 式中 是x的离均差和y的离均差的乘积之和,简称乘积和(sum of products),记作SP。 因而有: 三、直线回归方程的图示 四、直线回归的估计标准误 满足 为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。 Q 就是误差的一种度量,称之为离回归平方和(sum of squares to deviation from regression)或剩余平方和。 由于在建立回归方程时用了a 和b 两个统计数,故Q 的自由度ν=n-2。因而,可定义回归方程的估计标准误为: Q值的计算: 五、直线回归的数学模型和基本假定 1、数学模型 2、基本假定 (1)、Y 变数是随机变数,而X 变数则是没有误差的固定变量,至少和Y 变数比较起来 X 变数的误差小到可以忽略。 (2)在任一X上都存在着一个Y 总体,它是作正态分布的,其平均数 是X 的线性函数。 8.2.2 直线回归的假设测验和区间估计 一、直线回归的假设测验 1、回归关系的假设测验 (1)t 测验 若总体不存在直线回归关系,则总体回归系数β=0;若总体存在直线回归关系,则总体回归系数β≠0。 所以对直线回归的假设测验为: H0: β=0对HA: β≠0。 回归系数b的标准误为: [例9.3P163]试测验9.1资料回归关系的显著性。 接受HA: β≠0,即认为积温和一代三化螟盛发期是有真实的直线回归关系。 [例9.4P164]试用F测验法检测9.1资料回归关系的显著性。 于是条件总体平均数的95%的置信区间为: 故保证概率为0.95的Y(p)预测区间为: 8.3.1 相关系数和决定系数 一、相关系数 上述三图充分说明 的值可用来度量两个变数直线相关程度和性质。但是,X和Y的变异程度、所取单位及N的大小都会影响 为了具有可比性,需要将离均差转化为标准化离均差,再以N除之,从而得到双变数总体的相关系数 为: 后者是由X的不同而引起。显然,若坐标点愈靠近回归线,则U对SSy的比率愈大,直线相关就愈密切,故样本的相关系数r 为: 二、决定系数 决定系数(determination coefficient):由x 不同引起的 y 的平方和 占总平方和 的比率。 8.3.2 相关系数的假设测验 一、ρ=0的假设测验 假设H0:ρ=0对HA:ρ≠0。 R 的抽样误差为: [例9.12P175]试测验例9.11所得 r =-0.8371的显著性。 由于ν一定时,tα的值都是一定的,将其代入 ,整理后得到: 8.4.1 直线回归与相关的内在关系 1、相关系数是标准化的回归系数 回归系数是有单位的,但若对b 作消去单位的标准化处理,即对b中x 和y 的离均差以各自的标准差sx 和sy为单位,则有: 2、相关系数r 是y 依x 的回归系数by/x和x依y 的回归系数bx/y 的几何平均数。 8.4.2 直线回归和相关的应用要点 1、回归和相关分析要有学科专业知识指导。 2、要严格控制研究对象(X 和 Y )以外的有关因素。 3、直线回归和相关不显著,并
文档评论(0)