[生物学]第七章 简单回归与相关分析.ppt

  1. 1、本文档共106页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[生物学]第七章 简单回归与相关分析

第七章 简单回归与相关分析 回归与相关的概念 简单线性回归分析 简单线性相关分析 简单非线性回归分析 为什么要学习回归与相关分析 §7.1 回归与相关的概念 §7.2 简单线性回归分析 一、线性回归方程: 根据散点图可以看出: 两个变量相关的性质和密切程度或由x估计y的精确度; 两个变量的关系是直线型的还是非直线型的; 是否有一些特殊的不规则的点表示着其他因素的干扰等。 ◆ b﹥0时,表示y随x的增大而增大,呈正相关; ◆ b﹤0时,表示y随x的增大而减小,呈负相关; ◆ b=0或与0的差异不显著时,则表明y的变异和x的取值大小无关,直线回归关系不能成立。 1、作散点图 2、建立回归方程 ∑x=35.5+34.1+…+44.2=333.7 ∑x2=35.52+34.12+…+44.22=12517.49 ∑y=12+16+…+(-1)=70 ∑y2=122+162+…+(-1)2=794 ∑xy=(35.5×12)+(34.1×16)+…+ 〔 44.2×(-1) =2436.4 n=9 上述回归直线是9年观察值的代表,它不仅反映了X与Y的基本情况,也便于预测。 尽管这个回归直线是观察9年结果而得出的一般趋势,其代表性比任一坐标点都好,但这种估计还是有随机误差存在的。 Q是扣除X对Y的线性影响后,其余因素和随机误差引起的偏差平方和,称剩余平方和;U是X对Y 的线性影响所引起的偏差平方和,它在一定程度上反映了回归所引起的变异,称回归平方和。 §7.3 简单线性相关分析 简单相关分析是研究双变量线性资料在数量上的变化特征和规律的统计方法。或者说是以计算双变量资料线性相关系数为基础的统计方法。 一、相关系数与决定系数 1、相关系数r:表示x和y两类变量相关密切程度及性质的统计数。 相关系数的检验方法: F检验法 t检验法 直接查相关系数表法(df,变量个数) 4、r的数值总在-1和1之间,而b的数值大小变化很大。 根据r只能判断两个变量间的相关程度和性质;根据b能得到回归方程,从而推算依变量的变化规律。 r无单位, b是有单位的。 §9.4 简单非线性回归分析 前面所讲的是对两个变量间存在的线性相关关系进行的分析和讨论。但在实际问题中,随机变量Y和自变量X之间不一定都是线性相关的,这时如果假定它服从线性模型,得出的线性回归方程将没有什么意义。在此情况下,通常是先做散点图,然后根据散点图的分布形状,配置一条较为合适的曲线。 对于非线性回归分析,通常是先进行变量代换,把曲线化成直线形式,然后根据最小二乘原理拟合直线回归方程,并对此进行显著性检验,最后转化为曲线回归方程的形式。 2、线性回归和离回归的平方和也可用相关系数表示。 U=r2SSy, Q=(1-r2)SSy 3、r和b都是用来表示两个变量之间相关关系的统计数,二者在表示变量之间的变异性质和方向上是一致的。 即r为正值,b也为正值;r为负值,b也为负值; r为0,b也为0;r显著,b也显著;r不显著,b也 不显著。 ①回归系数的置信区间 回归系数标准误 df=9-2=7,t0.05=2.365 L1=-1.0996-2.365×0.2715=-1.7417 L2=-1.0996+2.365×0.2715=-0.4575  即对例7.1资料重复进行抽样调查试验,则由样本计算的回归系数b,将有95%把握落在〔-1.7417,-0.4575〕区间。  ②回归截距的置信区间 回归截距的标准误sa, df=n-2=9-2=7时,t0.05=2.365 L1=48.5485-2.365×10.1278=24.5963 L2=48.5485+2.365×10.1278=72.5007 即对例7.1资料重复进行抽样调查,将有95%样本的a值在〔24.5963,72.5007〕区间内。 ③当x=40旬·度时,y的估计值为 = 48.5485-(1.0996×40)=4.56 所以包括 在内有95%可靠度的置信区间为 L1=4.56-(2.36×1.35)=1.4(即5月12日) L2=4.56+(2.36×1.35)=7.7(即5月18日)  即3月下旬至4月中旬积温为40旬·度的年份,其一代三化螟蛾平均盛发期95%置信区间为〔1.4,7.7〕,或5月12日—18日。 ④当x=40旬·度时,总体单个观察值y的估计值为 = 48.5485-(1.0996×40)=4.56   故包括y在内有95%可靠度的置信区间为 L1=4.56-(2.36×3.53

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档