8—1第八讲简单回归分析—刘媛媛.pptVIP

  • 6
  • 0
  • 约3.04千字
  • 约 59页
  • 2017-04-22 发布于北京
  • 举报
8—1第八讲简单回归分析—刘媛媛

第十二章 简单回归分析;本章内容 第一节 简单线性回归 第二节 线性回归的应用 ; 双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1), (X2,Y2), …, (Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关; ; 儿子身高(Y,英寸)与父亲身高(X,英寸)存在线性关系: 也即高个子父代的子代在成年之后的身高平均来说不是更高,而是稍矮于其父代水平,而矮个子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton将这种趋向于种族稳定的现象称之“回归”; “回归”已成为表示变量之间某种数量依存关系的统计学术语,相关并且衍生出“回归方程”“回归系数”等统计学概念。如研究糖尿病人血糖与其胰岛素水平的关系,研究儿童年龄与体重的关系等。;一、线性回归的概念及其统计描述;; 在定量描述健康人凝血酶浓度(X)与凝血时间(Y)数据的数量上的依存关系时,将凝血酶浓度称为自变量(independent variable),用 X 表示;凝血时间称为应变量(dependent variable),用 Y 表示;图12-1 凝血酶浓度(X)与凝血时间(Y)的散点分布; 由图12-1可见,凝血时间随凝血酶浓度的增加而减低且呈直线趋势,但并非所有点子恰好全都在一直线上,此与两变量间严格的直线函数关系不同,称为直线回归(linear regression),其方程叫直线回归方程,以区别严格意义的直线方程。回归是回归分析中最基本、最简单的一种,故又称简单回归。 ; 为各X处Y的总体均数的估计。;1.a 为回归直线在 Y 轴上的截距;2. b为回归系数,即直线的斜率;二、回归模型的前提假设; ;图12-2 回归模型前提假设示意图;残差(residual)或剩余值,即实测值Y与假定回归线上的估计值 的纵向距离 。 求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。; ;本例:n=15 ΣX=14.7 ΣX2=14.81 ΣY=224 ΣXY=216.7 ΣY2=3368;;Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.;例题分析步骤;3、计算有关指标的值 4、计算回归系数和截距 5、列出回归方程; ;为 的标准误;(二)回归方程的假设检验 ;Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.;Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.;1.方差分析 ;Y的离均差,总变异;数理统计可证明: ;上式用符号表示为 ;Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.;上述三个平方和,各有其相应的自由度 ,并有如下的关系: ;Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd.;式中 ;2、t 检验 ; 检验例12-1数据得到的直线回归方程是否成立? ; 方法1:方差分析;方差分析表 ;方法2:t 检验;提示:;(三)总体回归系数 的可信区间; 本例b=-6.9802, 自由度=13,t0.05,13=2.16,Sb=0.78655, 代入公式(12-7)得参数β的95%置信区间为 =(-8.6791 ~ -5.2813) ;Evaluati

文档评论(0)

1亿VIP精品文档

相关文档