- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第9章 双变量相关与回归
医学上,许多现象之间也都有相互联系,例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等。在这些有关系的现象中,它们之间联系的程度和性质也各不相同。 这里,体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切得多,而体重和身高的关系则介与二者之间。 另外,可以说乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之间是因果关系;但是,有的现象之间因果不清,只是伴随关系,例如丈夫的身高和妻子的身高之间,就不能说有因果关系。 相关与回归就是用于研究和解释两个变量之间相互关系的。 一、简单线性回归 回归分析是研究一个变量(Y)和另外一个或一些变量(X)间线性依存关系的统计分析方法。 如在青少年生长发育研究中体重随着身高的增长而增长,按专业知识,描述两个变量的数量变化关系,宜将体重作为应变量(dependent variable),身高作为自变量(independent variable)。 依存关系 简单线性回归(simple linear regression) 一个X 多重线性回归(multiple linear regression) 多个X 一、简单线性回归 采用线性回归分析可以解决以下几方面的问题: 1、探讨体重是否随身高的增长而增加? 2、体重与身高的关系呈直线还是曲线关系? 3、如何采用回归方程定量地描述两者间的关系? 4、该地15岁男童身高每增加1厘米,体重平均增加多少公斤? 5、所建回归方程是否成立?即两变量间线性依存关系是否存在? 6、如何由身高预测该地15岁男童的体重? 一、简单线性回归 散点图 在做回归或者相关分析以前,对数据必须要做散点图! 为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的。例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图。 一、简单线性回归 一、简单线性回归 实际应用中采用简单线性回归模型来定量描述应变量与自变量之间的数量关系。 总体线性回归方程记作 β为总体回归系数(regression coefficient),即直线的斜率,其统计学意义是X每增加(或减少)一个单位,Y平均改变β个单位(即Y的均数改变β个单位)。表示Y随X改变的平均变化量,β0,表明Y随X的增加而增加;β0,表明Y随X的增加而减少;β=0,表明Y与X无线性回归关系。 α为回归直线在轴上的截距(intercept),其统计学意义为X取值为0时,方程所估计值Y的平均水平。截距的解释一定要符合专业实际 。 一、简单线性回归 设a和b是α和β的估计值,则可拟合得到样本线性回归方程 表示x取某定值时相应总体均数Y的点估计值,b称为样本回归系数,也是有单位,有符号的。 其回归方程满足三个基本性质:① 为最小;② ;③回归直线必然通过中心点 。 其中( )称为残差 (residual)。 一、简单线性回归 回归方程的估计:最小二乘法(保证回归方程满足三个基本性质) 保证各实测点至直线的纵向距离( )的平方和,即残差平方和 最小 。 考查回归直线是否正确的方法: 1、回归直线必然通过中心点 2,将回归直线左端延长与Y轴相交,交点纵坐标为截距3,要注意,直线只能在实测范围内应用,不能随意延长! 一、简单线性回归 回归分析的统计推断 Y变异的分解 一、简单线性回归 总体回归系数的假设检验——t检验 注意:在简单线性回归模型中,由于只有一个自变量,回归模型的方差分析等价于对回归系数的检验,且t= 。 另外,对回归系数的假设检验还有一种方法,即对相关系数作假设检验,在第二节讲到! 一、简单线性回归 拟合优度检验与决定系数 回归系数大小和两个变量的单位及大小有关,回归系数越大,说明Y随X的变化越快,但并不表明影响越大。为描述这种影响的大小以及回归方程拟合效果的好坏,引入决定系数(coefficient of determination)的概念。决定系数是简单线性回归与多重线性回归分析中一个重要的统计量,通常用R2表示。 因SS回归≤SS总,所以取值在0到1之间。它的大小反映了自变量对回归的贡献,说明在的总变异中用、回归关系所能解释的比重。决定系数越趋近于1,回归方程的拟合效果越好,因此,常把它作为评价回归方程效果,反映拟合优度的指标。 一、简单线性回归 回归分析的前提条件(LINE) 线性(linear) 独立性(independ
文档评论(0)