(实验数据)9回归分析 .pptx

(实验数据)9回归分析

第9章 回归分析;第9章 回归分析;变量之间的关系: 9.1.1 确定性关系(函数关系) 函数关系,经反复的精确试验或严格的数学推导得到。如 S= v﹒t 。数学分析和物理学中的大多数公式属于这种类型。; 实际问题中,绝大多数情况下,变量之间的关系不那么简单。如材料的性能与其化学成份之间等等。 这些变量之间既存在着密切的关系,又不能由一个(或几个)变量(自变量)的数值精确地求出另一个变量(因变量)的数值,而是要通过试验和调查研究,才能确定它们之间的关系,如图9.1所示,虽然各组数据不是准确地服从f(x)关系,但y值总还是随x的增加而增加。我们称这类变量之间的关系为相关关系。 ;; 虽然各组数据不是准确地服从f(x)关系,但y值总还是随x的增加而变化。;例如,炼钢厂在冶炼当中,成品含碳量和冶炼时间这两个变量之间,就不存在确定性的关系,对于含碳量相同的钢,冶炼时间却不相同. 再如,人的年龄与血压之间,要找出一个确定性的关系也是很困难的. 然而,这些变量之间还是有着密切的关系的,虽然各组数据不是准确地服从f(x)关系,但y值总还是随着x值的增加而变化.这种关系称为统计关系 .;回归分析与相关分析;1.回归与相关的关系;回归分析的主要内容: 应用数学的方法,对大量的测量数据进行处理,从而得出比较符合事物内部规律的数学表达式.;(9-1); 同时测量 x ,y 的数值,设有 m 对观测结果:; 式(9—3)中的 x 变化时,y 也随之变化。如果 m 对观测值中有比较多的 y 值落到曲线(9—1)上,则所得曲线就能较为满意地反映被测物理量之间的关系,y 值同时出现的概率最大,则曲线(9—3)就是曲线(9—1)的最佳形式。如图9.1a所示。如果误差服从正态分布,则概率 P(e1, e2, …, em)为: ;图9.1a; 这里假定 xi 无误差。式(9—7)可以写成:;9.3 直线的回归; 与 x 的关系大致呈直线关系,但并不是确定性的关系,而是一种相关关系:;其平方和为:;令平均值为:;; 由式(9-18)和式(9-19)可以求得回归直线方程式中的常数a及回归系数b。;便可得到回归系数的另一种表达式: ; 上述回归直线的具体计算,通常都是列表进行的,本节的示例,具体计算见表9-2。;直线回归分析步骤;例某乡为了提高小麦产量,经过多次试验,总结出一种小麦基本苗数推算成熟期有效穗数的方法。在5块田上进行对比试验,取得数据如下:;解:回归直线方程计算表(1);回归直线方程计算表(2);表9-1 试验数据;1)先把数据在Excel中成列输入到电子表格中; 2)全部选择所有数据; 3)点击图表向导快捷按钮,按提示一步一步建立散点图;;9.3.3 方差分析;两端平方求和得:; 上式中三项平方和的意义如下: ; 由图中可以看出,如果残差平方和很小,则回归平方和/总平方和将接近于1。这时,所有的观测点都靠近或落在回归线上,这就表明回归直线的精度较高。; 残差平方和是排除了 x 对 y 的线性影响后的剩余部分,y 值随机波动程度的大小,用它来估计误差。 产生原因:包括随机误差、那些影响很小但尚未考虑的因素。 自由度: f总= f回 + f残 f总= m - 1 f回 =1      f残= f总- f回 = m - 2; 方差:残差平方和除以它的自由度:;将例9.1一元直线回归的方差分析可归纳在表5-3中。;9.3.4一元线性回归方程的检验 ;用一个数量性的指标,来衡量两个变量之间线性相关关系的密切程度——相关系数 r 。;;(1) r = 0 时。此时 b = 0 ,即按最小二乘法确定的回归直线平行于 x 轴,这说明 y 的变化与 x 无关。故 x 与 y 之间没有线性关系。通常,散点的分布是完全不规则的,如图9.15(a)所示。 (2) 0≤|r|≤1。这时, x 与 y 之间存在着一定的线性关系。当 r >0 时 b>0 ,散点分布有随 x 增加 y 增加的趋势,此时称 x 与 y 是正相关,如图9.15(b)所示。当 r <0 时 b<0 ,散点图呈 y 随 x 增加而减小的趋势,此时称 x 与 y 为负相关,如图9.15(c)所示。当 r 的绝对值比较大时,散点远离回归直线较为分散;当 r 的绝对值较大时,散点分布就靠近直线。 (3) |r|= 1。所有

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档