- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
如,细菌生长数量(Y)与时间(X)呈指数函数关系Y=aebX,将等式两边取自然对数(或者取常用对数), 令:Y'=ln Y, a'=ln a, 则可变为线性回归方程, 至于对数函数 Y=a+lnX,只要令X'= lnX 即为线性方程: 若经以上三种变换,均不能直线化,则应考虑使用其他的方法做变换。 例 1 (p168) 在凝血实验中,测定15只鸡的维生素K摄入量X与添加血凝剂浓度Y,求Y对X的回归关系。 先在直角坐标系上做散点图,判断X和Y是否存在线性关系。 根据散点图情况选择适当的曲线来配合实验数据,进行数据变换。 由于在对数变换(即logX和logY)的直线化程度最高。因此,令: 则 Y’ = a’+bX’ 可以按照一元线性回归进行分析。 by’x’= -1.89, a’=3.01 因为a’=log a,所以 a=1023.29 所以,Y = aXb=1023.29X-1.89 二、曲线配合的拟合度 一般情况可用剩余均方的大小,来判断拟合的优劣,剩余均方愈小,拟合愈好。但计算剩余平方和时,必须用实际观察值与回归估计值之差的平方和计算。 可见幂函数的决定系数远远大于线性的,即剩余均方更小。因此幂函数回归比线性拟合得好,为了得到最理想的回归关系,最好多做几种变换,从中选出最优者。 * * 多元线性回归(multiple Linear regression) 一、多元线性回归模型 在回归问题中,一个量只受一种因素影响的情况是较少的,往往是很多因素共同影响一个量。 例如,农作物的产量,除受种植密度影响之外,还受施肥量、灌水量和田间管理次数等的影响。 例如,动物体重的增加与饲料中蛋白质含量、饲料总量和每日透料次数等都有关。 特别是当几个自变量之间还存在相关时,只考虑一个自变量与因变量的关系,往往得不到正确的结果。必须同时考虑几个因素的共同作用,才能得到比较正确的结论。这就是我们要讨论的多元回归问题。 一个典型的多元回归资料,可以列成下表。 表 10.1 典型的多元线性回归数据 第p 次观察值为: 其中e1,e2,… ,en是相互独立且服从正态分布的随即变量。该式即所谓的多元线性回归模型。 多元线性回归和一元线性回归一样,用最小二乘法求a和bj 的估计值a和bj 。所不同的是,一元回归中,只需求出a和1个b,而多元回归中则需求出a和k个b。用a和b1,b2,… ,bk 分别表示a和b1,b2,… ,bk 的估计值。根据最小二乘法,回归方程 其中的a和bj应使得全部实际观察值 与回归估计值?p的离差平方和达到最小。 将方程组整理 ,可得 正规方程 解上述方程组,可以得到b1,b2,…,b k。a由(1)式给出, 由实际观察值,计算得到的bj是bj的无偏估计量,a是a的无偏估计量,于是得到多元回归方程: 其中a为常数项;b1,b2,… ,bk分别称为Y对X1,X2,… ,Xk的偏回归系数(partial regression coefficient)。它表示当其它自变量都固定时,该自变量每变化一个单位而使因变量平均改变的数值。 二、多元回归方程的计算 例10.1 为研究黄牛的体重与体长和胸围的关系。测定了20头鲁西黄牛的体长、胸围和体重,试建立体重对体长和胸围的回归方程。 (教科书中p150) 序号 体长X1 胸围X2 体重Y 序号 体长X1 胸围X2 体重Y 1 2 3 4 5 6 7 8 9 10 151.5 156.2 146.0 138.1 146.2 149.8 155.0 144.5 147.2 145.2 186.0 186.0 193.0 193.0 172.0 188.0 187.0 175.0 175.0 185.0 462.0 496.0 458.0 463.0 388.0 485.0 455.0 392.0 398.0 437.0 11 12 13 14 15 16 17 18 19 20 138.0 142.5 141.5 149.0 154.2 152.0 158.0 146.8 147.3 151.3 172.0 192.0 180.0 183.0 193.0 187.0 190.0 189.0 183.0 191.0 378.0 446.0 396.0 426.0 506.0 457.0 506.0 455.0 478.0 454.0 解 将数据按表中的要求整理好,然后计算 于是得出二元回归方程 方程中的3.03和3.80都称为偏回归系数。偏回归系
文档评论(0)