- 1、本文档共52页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11讲_简单线性回归概要
简单线性回归 回归是设法找出变量间在数量上的依存变化关系, 用函数表达式表达出来,这个表达式称之为回归方程。 两变量间的关系 确定性关系:两变量间的函数关系 圆的周长与半径的关系: C=2?R 速度、时间与路程的关系:L=ST X与Y的函数关系: Y=a+bX 非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。 青少年身高与年龄的关系; 身高与体重的关系:标准体重(kg)=身高(cm)-105 药物浓度与反应率的关系; 一、线性回归的概念 当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系。 其中X 为自变量(independent variable);Y是因变量( dependent variable )。 但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或线性回归。 小插曲:为什么叫”回归“? 二、回归参数的估计 式中的 是由自变量X推算应变量Y的估计值,a是回归直线在Y 轴上的截距;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。 计算原理:最小二乘法,即保证各实测点到回归直线的纵向距离的平方和最小,并使计算出的回归方程最能代表实测数据所反映出的直线趋势。 例12-1 某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得20名正常成年男性的有关数据,散点图如下。 年龄与运动后最大心率的回归方程 回归系数和回归方程的意义及性质 b 的意义 a 的意义 的意义 的意义 的意义 b 的意义 斜率(slope) =301.3124 -3.218 X 年龄每增加 1 岁,其运动后最大心率平均减少 3.218(次/分钟) b 的单位为 (Y的单位/X的单位) b is the regression coefficient and the slope of the line 。 b0,y increase with the increase of X b0,y decrease with the increase of X b=0,no linear correlation between two variables. a 的意义 估计值 的意义 X=46时, =153.2844, 即年龄为 46岁 的正常成年男性, 其平均运动后最大心率估计值为 153.2844 (次/分钟); 给定X时,Y的估计值。 当 时, 的意义 残差平方和 (residual sum of squares). 综合表示点距直线的纵向距离。 在所有的直线中,回归直线的残差平方和是最小的。(最小二乘) 三、总体回归系数的假设检验 与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。总体的回归系数用β表示。 一般步骤 H0:β=0 回归方程无意义 H1:β≠0 回归方程有意义 α=0.05 选择合适的假设检验方法(方差分析或t检验),计算统计量 计算概率值P 做出推论:统计学结论和专业结论 方差分析法 因变量总变异的分解 Y的总变异分解 未引进回归时的总变异: (sum of squares about the mean of Y) 引进回归以后的变异(剩余): (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression) Y的总变异分解 剩余标准差 回归系数检验的基本思想 如果X与Y无线性回归关系,在SS回归和SS剩余都是其他随机因素对Y的影响,由此,MS回归≈MS剩余,总体回归系数β=0,反之, β ≠ 0。所以用F检验对X与Y之间有无回归关系进行检验。 公式 t检验法 H 0: ?=0, H 1: ?≠0, ? =0.05。 决定系数(coefficient of determination) 取值在0到1之间,反映了回归贡献的相对程度。 决定系数除了作为回归拟合效果的概括
文档评论(0)