- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学简单回归分析
第十二章 简单线性回归 Simple linear regression analysis 流行病学与卫生统计学教研室 曹 明 芹 Regression 释义 第十二章 简单线性回归 线性回归 线性回归的应用 残差分析 回归分析应注意的问题 非线性回归 一、线性回归 线性相关:分析两个变量的相关关系的方向及密切程度的统计方法 欲分析两个变量在数量上的依存关系或者由一个易测变量推测另一个难测变量,采用回归分析。 简单线性回归:涉及一个应变量和一个自变量 多重线性回归:涉及一个应变量和多个自变量 例:体重与体表面积、胰岛素水平与血糖水平 用身高、体重、肺活量估计心室输出量 一、线性回归 简单线性回归模型的一般形式 线性回归分析的基本步骤 线性回归分析的条件 (一)简单线性回归模型的一般形式 例: 随机抽取15名健康成年人,测定其血液的凝血酶浓度(单位/毫升)及凝固时间(秒),数据如下表所示: (一)简单线性回归模型的一般形式 若描述凝血酶浓度和凝血时间在数量上的依存关系时(回归分析),应变量为凝血酶浓度,自变量为凝血酶时间。 Y 表示应变量,因变量,响应变量 (dependent variable, response variable) X 表示自变量,解释变量,预测因子 (independent variable, explanatory variable,predictor) 用数学上的二元一次方程形式表示简单线性回归 (一)简单线性回归模型的一般形式 总体回归模型表示为: 样本回归模型表示: (一)简单线性回归模型的一般形式 a 的意义 a 截距、常数项 (intercept, constant) X=0 时,Y 的估计值 a 的单位与Y 值相同 当X 可能取0时,a 才有实际意义。 (一)简单线性回归模型的一般形式 b 的意义 b 斜率(slope) b 的单位为 (Y 的单位 / X 的单位) b0,直线从左下方走向右上方,Y 随 X 增大而增大; b0,直线从左上方走向右下方,Y 随 X 增大而减小; b=0,表示直线与 X 轴平行,X 与Y 无直线关系 在回归分析中,将b称为回归系数(regression coefficient) (一)简单线性回归模型的一般形式 b 的意义 b 表示X 每增加(减)一个单位,Y 平均改变b个单位 例:1~7岁儿童以年龄(岁)估计体重(Kg)的回归方程为 例:以凝血酶浓度(单位/毫升)估计凝血时间(秒)的回归方程为 (一)简单线性回归模型的一般形式 的意义 给定X 时,Y 的估计值 给定X 时,Y 的平均值(总体均数的点估计) 举例 (二)线性回归分析的基本步骤 绘制散点图(观察是否有线性趋势、异常点) 估计回归参数,列出回归方程 对回归方程进行假设检验 在散点图上绘制回归直线 解释回归系数的统计学意义 评价回归方程的拟合效果 (二)线性回归分析的基本步骤 绘制散点图(观察是否有线性趋势、异常点) (二)线性回归分析的基本步骤 估计回归参数,列出回归方程 求解a、b,实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。 最小二乘法原理估计 残差(residual)或剩余 即实测值Y与假定回归线上的估计值 的纵向距离 最小二乘法(least sum of squares):回归的残差平方和最小,即各实测点至直线的纵向距离的平方和最小。 (二)线性回归分析的基本步骤 估计回归参数,列出回归方程 最小二乘法原理估计的回归直线必过点 公式为 可使用计算器计算或软件计算 (二)线性回归分析的基本步骤 对回归方程进行假设检验 方差分析 回归系数的t检验 b≠0,推断是否? =0 ,若? =0,则回归关系不存在。 H0:? =0,无直线回归关系; H1:?≠0,有直线回归关系; (二)线性回归分析的基本步骤 方差分析 将应变量Y的总变异划分成两部分,一部分是由线性回归所致的变异,另一部分是由残差所致的变异 总的离均差平方和相应划分为两部分 总的自由度相应划分为两部分 应变量Y的总变异的分解 Y的总变异(离均差平方和)分解 总变异: (sum of squares about the mean of Y) 剩余(残差)的变异: (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression) Y 的自由度分解 总的自由度:
文档评论(0)