生物统计学教案(10).docVIP

  • 2
  • 0
  • 约6.96千字
  • 约 19页
  • 2018-11-03 发布于安徽
  • 举报
. PAGE .. 生物统计学教案 第十章 一元回归及简单相关分析 教学时间:5学时 教学方法:课堂板书讲授 教学目的:重点掌握一元线性回归方程,掌握一元线性回归方程的检验和相关,了解一元非线性回归和多元回归与相关。 讲授难点:一元线性回归方程的检验和相关 10.1 回归与相关的基本概念 函数关系:F=ma 相关关系:单位面积的施肥量、播种量和产量;血压和年龄;胸径和高度;玉米的穗长和穗重;身高和体重。 相关:设有两个随机变量X和Y,对于任一随机变量的每一个可能的值,另一个随机变量都有一个分布与之相对应,称X和Y存在相关。 回归:对于变量X的每一个可能的值xi,都有随机变量Y的一个分布相对应,则称随机变量Y对变量X存在回归。X称为自变量,Y称为因变量。 条件平均数:当X=xi时Y的平均数μY.X=xi,称为条件平均数。 10.2 一元线性回归方程 10.2.1 散点图 NaCl含量X(g/kg土壤) 0 0.8 1.6 2.4 3.2 4.0 4.8 干重Y(mg/dm2) 80 90 95 115 130 115 135 例 不同NaCl含量对单位叶面积干物质的影响 从上图虽可以看出Y对X的线性关系,但点子并不在一条直线上。 例 每一NaCl含量下干物质10次重复值 干重(mg/dm2)重复值 NaCl含量(g/kg土壤) 0 0.8 1.6 2.4 3.2 4.0 4.8 1 80 90 95 115 130 115 135 2 100 85 89 94 106 125 137 3 75 107 115 103 103 128 128 4 89 93 92 110 110 143 127 5 91 103 115 113 128 132 155 6 79 92 120 108 131 121 132 7 101 78 95 121 117 129 148 8 85 105 95 110 121 112 117 9 83 93 105 108 114 120 134 10 79 85 98 111 116 130 132 平均值 86.2 93.1 101.9 109.3 117.6 125.5 134.5 如果增加每一NaCl浓度下的重复次数,用其平均值画成散点图,则点子直线化的程度要好得多。上表给出10次重复的平均值,从下图中可见,点子更接近在一条直线上。当以Y的条件平均数所做的散点图,则完全在一条上。 10.2.2 一元正态线性回归模型 xi和各xi上Y的条件平均数μy.x可构成一条直线: μY=α+βX 对于变量X的每一个值,都有一个Y的分布,其平均数是上式所示的线性函数。对于随机变量Y: Y=α+βX+ε ε:NID(0,σ2) Y:NID(α+βX,σ2) 上式称为一元正态线性回归模型。 10.2.3 参数α和β的估计 在实际工作中,我们是无法得到α和β的,只能得到它们的估计值a和b,从而得到一条估计的回归线: 上式称为Y对X的回归方程,所画出的直线称为回归线。a是直线的截距,称为常数项;b是直线的斜率,称为回归系数。 对于因变量Y的每一个观测值yi: yi = a + bxi + ei yi 的回归估计值是对的估计,因此也是平均数。 在各种离差平方和中,以距平均数的离差平方和为最小。因此我们就把ei = yi-平方和为最小的直线作为最好的回归线。 记,求出使L达到最小时的a和b,这种方法称为最小二乘法。 为使达到最小,令: 可以得到以下一组联立方程: 解该方程组,得到β的最小二乘估计: 及a的最小二乘估计: 公式的分子部分称为X和Y的校正交叉乘积和,以SXY表示。分母部分称为X的校正平方和,以SXX表示。因变量Y的 平方和称为总平方和,以SYY表示。因此,b又可以表示为: 回归方程的计算 X X’=X-2.4 X’2 Y Y’=Y-110 Y’2 X’Y’ 0 -2.4 5.76 80 -30 900 72 0.8 -1.6 2.56 90 -20 400 32 1.6 -0.8 0.64 95 -15 225 12 2.4 0 0 115 5 25 0 3.2 0.8 0.64 130 20 400 16 4.0 1.6 2.56 115 5 25 8 4.8 2.4 5.76 135 25 625

文档评论(0)

1亿VIP精品文档

相关文档