- 1、本文档共68页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Chapter 14 Multiple linear regression and correlation;;例14-1;某研究者将脂联素作为应变量y,4 种相关因素分别作为自变量xi,逐一采用简单直线回归分析方法,建立了 4 个直线回归方程
据此认为,脂联素分别与体重指数、瘦数呈负相关,而与病程和空腹血糖无相关;问题与分析;第一节 多重线性回归与相关;一、多重线性回归模型;一、多重线性回归模型;一、多重线性回归模型;二、多重线性回归方程的建立;二、多重线性回归方程的建立;二、多重线性回归方程的建立;二、多重线性回归方程的建立;知识点14-1;三、多重线性回归的假设检验和评价;回归方程假设检验的目的
推断多个自变量作为一个整体与应变量间的线性关系是否存在,即整个方程是否有统计学意义 ;1. 回归方程的假设检验;1. 回归方程的假设检验;1. 回归方程的假设检验;【回归方程的假设检验步骤】 (例14-1);【回归方程的假设检验步骤】 (例14-1);(1) 决定系数 R2 (coefficient of determination)
概 念(同简单线性回归)
回归平方和在总平方和中所占的百分比
公 式
取值范围:0≤R2≤1
意 义
说明回归方程中的 m 个自变量能解释 y 变异的比重,即回归方程能在多大程度上解释y的变异
R2 越接近 1,y 的变异中由 m 个自变量解释的部分越多,回归方程对数据的拟合程度越好,引入这些相关自变量的效果越好 ;(1) 决定系数 R2 (coefficient of determination)
例14-1多重线性回归方程的决定系数
由方差分析表中得
SS回归= 1773.346
SS总= 2425.301
决定系数
表明所建立的回归方程可解释脂联素变化的73.12% ;(2) 校正决定系数 R2c (adjusted determination coefficient )
公 式
意 义
R2c 用于评价回归方程的优劣,此值越大,所建方程越好;(3) 复相关系数 R (multiple correlation coefficient )
意 义
1.可于说明应变量 y 与多个自变量之间的线性相关关系的密切程度
2. ,取值介于 0 和 1 之间,与简单线性相关系数不同,没有负值
本例的复相关系数为
如果只有1个自变量,则R = |r|
3. R 越接近 1,多个自变量与应变量的相关越密切
4. R 值随引入方程中的变量个数增加而增加
5. 其??设检验等价于多重线性回归方程的假设检验 ;1.多重线性回归方程的假设检验方法用F 检验
2.多重回归方程的评价指标包括决定系数、校正决定系数、复相关系数、剩余标准差
3.决定系数用来说明回归方程中的 m 个自变量(x1、x2、...xm)能解释 y 变异的比重,
4.复相关系数是多重相关分析的指标,可用来说明应变量 y 与多个自变量之间的线性相关关系的密切程度的指标 ;1.回归方程与偏回归系数假设检验的主要区别
(1)多重线性回归方程的假设检验的目的:将所有自变量作为一个整体来检验它们与应变量的相关程度和解释的比重,未指明方程中每一个自变量对应变量的影响,其中只要有一个自变量对应变量的影响有统计学意义,整体上就可以解释
多重线性回归方程的假设检验多用方差分析
(2)偏回归系数的假设检验的目的:对每一个自变量的作用进行检验和评价,衡量其对应变量的作用大小
偏回归系数的假设检验多用 t 检验 ;(1) 建立检验假设,确定检验水准
H0: βj = 0,自变量xj与应变量无线性依存关系
H1: βj≠0 ,自变量xj与应变量有线性依存关系
α=0.05
(2) 计算检验统计量 t 值
(3) 确定 P 值,做出统计推断
P>0.05,不拒绝H0,偏回归系数无统计学意义,尚不能认为自变量 xj 与应变量间有线性关系
P≤0.05,拒绝H0,接受H1,偏回归系数有统计学意义,可认为自变量xj与应变量间有线性关系;据SPSS分析结果,瘦素与脂联素之间存在线性依存关系(P=0.004),瘦素与脂联素之间呈负相关关系(b=-0.811);而体重指数、病程、空腹血糖的偏回归系数均无统计学意义(P≥0.064);由于各自变量的单位不同,得到的偏回归系数单位也不同,因此未标准化的偏回归系数的大小只能表明自变量与应变量在数量上的关系,而不能表示各自变量对应变量的作用大小
要比较各个自变量的作用大小,必须消除单位的影响。
文档评论(0)