生物统计学课件:第七章 直线回归与相关分析.ppt

生物统计学课件:第七章 直线回归与相关分析.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二步:假设检验 说明粘虫孵化历期平均温度与历期天数之间有极其显著的直线回归关系。 3. 利用回归方程进行点预测和区间预测 若线性回归作显著性检验的结果是放弃H0,也就是放弃回归系数β=0的假设,便可以利用回归方程进行点预测和区间预测,这是人们关注线性回归的主要原因之一。 ⑴ 当x=x0时, Y0的观测值y0的点预测是无偏的。 点估计 若Y与样本中的各Y相互独立,则根据 Z=Y0-(a+bx0)服从正态分布,E(Z)=0, Z与Qe相互独立 区间估计 置信区间: 假设用t检验 例:有人研究了粘虫孵化历期平均温度(x)与历期天数(y)之间的关系,试建立直线回归方程,并检验其显著性水平。若某年的历期平均温度为15 0C,该年粘虫孵化的历期天数为多少天(取95%置信区间)? x(0C) 11.8 14.7 15.6 16.8 17.1 18.8 19.5 20.4 y(d) 30.1 17.3 16.7 13.6 11.9 10.7 8.3 6.7 解: 置信区间: 4.相关系数 正相关 负相关 不相关 假设检验 回归:t检验法 当H0:β=0为真时, 例:有人研究了粘虫孵化历期平均温度(x)与历期天数(y)之间的关系,求x与y的相关系数,并检验其显著性水平。 x(0C) 11.8 14.7 15.6 16.8 17.1 18.8 19.5 20.4 y(d) 30.1 17.3 16.7 13.6 11.9 10.7 8.3 6.7 拒绝H0,说明粘虫孵化历期平均温度与历期天数之间有着极其显著的负相关性。 直线回归分析 第七章 1 2 3 4 5 6 4 3 2 1 1 2 3 4 5 6 4 3 2 1 1 2 3 4 5 6 4 3 2 1 正向直线关系 负向直线关系 曲线关系 直线关系是两变量间最简单的一种关系。 这种关系仅在变量的一定取值范围内可用,范围过大,散点图就偏离直线,需要借助于曲线描述。 数学上“回归”一词第一个被英国生物统计学家高尔顿(Galton)用于研究人类身高的遗传问题上. 他研究的结论是:很高(或矮)的双亲 的儿子们一般高(或低)于平均值,但不像他们的双亲那么高(或矮).因此儿子们的高度将“回归” 到平均值,而不是更趋极端,这也是“回归”一词的最初含义. 一元线性回归 1. 一元线性回归的基本概念 一元线性回归可用来分析自变量x取值与因变量Y取值的内在联系,不过这里的自变量x是确定性的变量,因变量Y是随机性的变量,它们的内在联系用所谓的一元线性回归方程来表示 . 进行n次独立试验,测得数据如下: 我们的问题是,如何根据这些观测值用“最佳的”形式来表达变量Y与x之间的关系? 一元线性回归模型可表示为: 被预测或解释的变量,称为因变量(dependent variable),用y表示。 用来预测或用来解释因变量的一个或多个变量,称为自变量(independent variable),用x表示。 一般而言,根据样本观测值(x1,y1),(x2,y2), …,(xn,yn)对未知参数α、β及σ2所作的估计与检验称为一元线性回归分析,而α称为截距,β称为回归系数, E(Y)=α+βx 称为回归方程。 根据样本及其观测值可以得到α、β及 σ2的估计量及估计值 得到回归方程的估计式或经验回归方程 x E[Y]= α+ ?X Xi } } ?= 斜率 1 α=截距 Yi { 误差: ?i 回归直线图 y 有多种确定回归方程也就是确定未知参数 的方法,其中最常用的是最小 二乘法, 最小 建立一元线性回归方程的具体步骤: (3)计算a和b,写出一元线性回归方程。 x 9 13 15 17 18 26 22 20 23 28 30 33 y 3 5 4 6 7 9 8 7 10 11 10 12 x 9 13 15 17 18 26 22 20 23 28 30 33 y 3 5 4 6 7 9 8 7 10 11 10 12 将a、b和Qe以及 看作是统计量,它们的表达式分别为 这些统计量之间以及它们与总体参数之间 有以下的内在联系: 2. 线性回归方程的显著性检验 一元线性回归的应用极其广泛,可是它的 应用必须有一个前提,那就是:在变量x取 值以后,Y所取的值服从N (α+βx,σ2)分布。 然而,根据最小二乘法,在建立回归方程的 时候,并不知道Y所取的值是否服从 N (α+βx,σ2)分布。换一句话说,即使Y所取的值不服从N (α+βx,σ2)分布,也可以建立一个回归方程。因此,必须对回归方程的拟合情况

文档评论(0)

学习让人进步 + 关注
实名认证
内容提供者

活到老,学到老!知识无价!

1亿VIP精品文档

相关文档