- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1)了解回归分析的基本原理; 2)掌握MATLAB的实现方法; 3)练习用回归分析方法解决实际问题; 实验目的 某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回归模型,且分析哪些是主要的影响因素。 引例:某建筑材料公司的销售量因素分析 设:推销开支——x1 实际帐目数——x2 同类商品竞争数——x3 地区销售潜力——x4 ? ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 5.5 2.5 8.0 3.0 3.0 2.9 8.0 9.0 4.0 6.5 5.5 5.0 6.0 5.0 3.5 8.0 6.0 4.0 7.5 7.0 31 55 67 50 38 71 30 56 42 73 60 44 50 39 55 70 40 50 62 59 10 8 12 7 8 12 12 5 8 5 11 12 6 10 10 6 11 11 9 9 8 6 9 16 15 17 8 10 4 16 7 12 6 4 4 14 6 8 13 11 79.3 200.1 163.2 200.1 146.0 177.7 30.9 291.9 160.0 339.4 159.6 86.3 237.5 107.2 155.0 201.4 100.2 135.8 223.3 195.0 x1 x2 x3 x4 y 1 1 1 1 . . . 1 1 1 1 1 X= 寻找关系: y = E(Y|x1,x2,x3,x4) = f(x1,x2,x3,x4) 模型: 假设: 1、因变量Y是随机变量,并且它服从正态分布; 2、f(x1,x2,x3,x4)是线性函数(非线性); 2、多元线性回归模型 模型要解决的问题可归纳为以下几个方面: 1) 在回归模型中如何估计参数βi (i=0,1,…,m)和σ2? 2) 模型的假设(线性)是否正确? 3) 判断每个自变量xi (i=1,…,m)对Y的影响是否显著? 4) 利用回归方程对试验指标 Y进行预测或控制? 知识介绍 参数估计 假设有n个独立观测数据(xi1,xi2,…,xim,yi), i = 1,2,…,n, 要确定回归系数 由最小二乘法 求解结果 y的估计值: 拟合误差 e = y – y 称为残差, 残差平方和 统计分析 1、β是β的线性最小方差无偏估计 2、 3、残差平方和Q, 由此得σ2的无偏估计 4、对Y的样本方差S2进行分解 回归模型的假设检验 构造F-统计量及检验H0的拒绝域: 注意:衡量y与x1,x2,…,xm相关程度的指标可以定义复相关系数R,R的值越接近于1,它们的相关程度越密切。 回归系数的检验 主要判断每个自变量xi对y的影响是否显著。 由此可得 MATLAB软件实现 b = regress (Y, X) 或 [b, bint, r, rint, stats] = regress(Y, X, alpha) 1、使用命令regress实现多元线性回归 回归系数β0,β1,…,βm以及它们的置信区间 残差向量e=Y-Y及它们的置信区间 相关系数R2,F-统计量和与F对应的概率p. 引例求解: 输入:(jzhui.m) x1=[5.5 2.5 8 3 ……8 6 4 7.5 7]’;(20维) x2=[31 55 67 …… 55 70 40 50 62 59]; x3=[10 8 12 …… 11 11 9 9]; x4=[8 6 9 16 …… 8 13 11]; y=[79.3 200.1 …… 135.8 223.3 195]; X=[ones(size(x1)),x1,x2,x3,x4]; [b,bint,r,rint,stats]=regress(y,X) 计算结果: (输出) b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501 β0 β1 β2 β3 β4 bint = 103.1071 280.7245……(系数的置信区间) r =[ -6.3045 -4.2215 ……8.4422
文档评论(0)