[化学]统计分析法2.pptVIP

  • 19
  • 0
  • 约3.52千字
  • 约 82页
  • 2018-03-01 发布于浙江
  • 举报
[化学]统计分析法2

生物统计学 Biostatistics;Part 4 统计分析方法;内 容;4.4 回归与相关分析 (Regression and correlation) ;变量间的关系;变量间的关系;变量间的关系;相关变量间的关系;统计学上采用回归分析 (regression analysis)研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为因变量。 包括一元回归分析、多元回归分析。;回归模型的类型; 回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制因变量(结果)。 ;统计学上采用相关分析(correlation analysis)研究呈平行关系的相关变量之间的关系。;相关分析;内 容;一元线性回归及相关分析;一元线性回归分析;;1、一元线性回归方程的拟合 ;(x、y)的散点图; 从散点图可以看出: ①两个变量间有关或无关;若有关,两个变量间关系类型,是直线型还是曲线型; ②两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切)。 ; 例1:土壤内NaCl含量对植物的生长有很大影响,NaCl含量过高,将增加组织内无机盐的累积,抑制植物的生长。下表是每1000g土壤中所含NaCl的不同克数(X),对植物单位叶面积干物重的影响(Y)。;散 点 图;每一 NaCl 含量下干物重 10 次重复值 ;散 点 图; 在实际应用时,不可能无限重复实验,在散点图上,只能作出少数有限个点。在点子比较少的情况下,表示两变量间的关系的直线可以画出许多条,其中哪一条是最好的呢?; 若 X 是可控制的变量,在实验无限重复之后,则可以得到在xi的 Y 的条件平均数 μY·X ,这些平均数构成一条直线。 ;对于Y的每一个观察值,可以用以下模型描述: ; 一般情况下,只能通过实验或调查获得有限对数据。因此,得不到真正的a和b。只能求出它们的估计值a和b,从而得到一条估计的直线, ; 怎样通过实际数据,得到总体回归a和b的最好点估计值a和b?; 平均数有一个特性,即在各种离差平方和中,以距平均数的离差平方和最小。在回归问题中,则在 ci 处Y 的实际观察值 yi 对它们的条件平均数 mYci =a+bci 离差平方和最小???因此,观察值与回归估计值之间的离差平方和L=∑(yi-yi)2 达到最小时的回归线作为最好的回归线。换句话说,选择的a和b,应该使L最小。这种方法称为最小二乘法。;ei; ; 误差平方和、剩余平方和 (residual sum of squares). 综合表示点距直线的距离。 在所有的直线中,回归直线的残差平方和是最小的。(最小二乘);即:;整理得关于a、b的正规方程组: ;SXY :X和Y的校正交叉乘积和 (corrected sum of cross products) SXX:X的校正平方和(corrected sum of squares for X) SYY:关于Y 的总校正平方和(total corrected sum of squares for Y) ;37; 例1:土壤内NaCl含量对植物的生长有很大影响,NaCl含量过高,将增加组织内无机盐的累积,抑制植物的生长。下表是每1000g土壤中所含NaCl的不同克数(X),对植物单位叶面积干物重的影响(Y)。;散 点 图;例1:将原始数据整理后列出下表:;41;42;用Excel进行回归分析;2、一元线性回归方程的检验;相关分析 (correlation analysis) ;相关关系;简单相关分析;相关关系示意图;相关系数的分析;相关系数 (取值及其意义);相关系数取值的意义;相关系数的检验;;例1中: r=0.929,查表得r0.01=0.874, rr?0.01,故相关极显著,回归方程有效。;相关系数与回归系数的关系;直线回归分析将二个相关变量区分为自变量和因变量,侧重于寻求它们之间的联系形式——直线回归方程;直线相关分析不区分自变量和因变量,侧重于揭示它们之间的联系程度和性质——计算出相关系数。两种分析所进行的显著性检验都是解决Y与X间是否存在直线关系。 因而二者的检验是等价的。即相关系数显著,回归系数亦显著;相关系数不显著,回归系数也必然不显著。 ; 在实

文档评论(0)

1亿VIP精品文档

相关文档