- 1、本文档共55页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
*利用MATLAB中逐步回归命令解决问题:(1)输入数据Y=[79.3200.1163.2200.1146.0177.730.9291.9160.0339.4159.686.3237.5107.2155.0201.4100.2135.8223.3195.0]’;X=[5.531.010.08.02.555.08.06.0…………..7.059.09.011.0];此处省略了部分数据(2)逐步回归为简单起见,先在模型中考虑全部变量,然后逐个加入对y影响不显著的变量.在命令窗口输入:stepwise(X,Y)↙*点击左侧的按钮nextstep,X3的置信区间线段变为蓝色,表示变量X3已经进入模型中.如下图*再点击左侧的按钮nextstep,X2的置信区间线段变为蓝色.*在以上过程中,决定系数R2增大,F的值增加,对应的概率P值明显减小,剩余标准差RMSE明显减小.*也可以直接点击右侧的Allsteps按钮一次完成变量的自动选择.如果再加入变量X1,X4时,决定系数几乎没变化,但F的值明显减小了,RMSE的值增大了.这两个变量不宜留在模型中,因此可以忽略X1和X4对y的影响!因此X2、X3是Y的主要影响因素.下面使用另一个命令函数再做这个实验.如果使用stepwiselm(x,y)命令,并不出现交互的窗口,而是在命令窗口直接动态地给出结果.*在命令窗口输入:mdl=stepwiselm(X,Y)↙1.正在添加x3,FStat=29.0275,pValue=4.04289e-052.正在添加x2,FStat=49.6984,pValue=1.95221e-06mdl=线性回归模型:y~1+x2+x3估计系数:EstimateSEtStatpValue(Intercept)186.0535.8435.19067.3688e-05x23.09070.438417.04971.9522e-06x3-19.5142.3915-8.15962.7862e-07观测值数目:20,误差自由度:17均方根误差:24R-方:0.902,调整R-方0.891统计模型(常量模型):78.6,p-值=2.56e-09*(3)变量Y和X2、X3的回归方程回归模型的常数项Intercept为186.0484,X2的系数为3.0907,X3的系数为-19.5140,故模型为以上计算的结果并没有把变量X1引入模型,和我们的直观感觉不一致。X1表示推销的开支,推销应该是有利于销售的.下面我们对模型做进一步的诊断.用X2和X3建立的上述回归模型中,剩余标准差s=24相对y的值来说较大.下面分析残差:(4)模型的分析与诊断*在命令窗口输入:plotResiduals(mdl,probability)↙可见有一个残差小于-80(图省略)且严重偏离拟合直线.找到对应的数据:在命令窗口输入:find(mdl.Residuals.Raw-80)↙ans=16排除第16个数据重新拟合:在命令窗口输入:*stepwiselm(X,Y,Exclude,16)↙1.Addingx3,FStat=29.4601,pValue=4.5237e-052.Addingx2,FStat=587.0139,pValue=4.882293e-143.Addingx1,FStat=5.9635,pValue=0.0274684.Addingx1:x3,FStat=8.3808,pValue=0.011759mdl=线性回归模型:(模型为:y~1+x2+x1*x3估计系数:EstimateSEtStatpValue(Intercept)135.9317.
文档评论(0)