- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
A题思路之一——多元非线性回归分析
本题求解关键为建立工资与其他7个因素之间的关系模型,可以考虑采用回归分析法,也可以考虑其他方法;
以下仅以回归分析法过程为例给出分析思路,仅供参考:
注意:根据下述结果发现本问题应该考虑为多元非线性回归,因此请大家优先挑出使用非线性回归模型的论文,其余酌情考虑。
1.数据预处理
1)为数据分析方便,应该考虑名义变量或有序变量的量化处理(编码),如可以考虑如下编码方案(含符号约定):
-日平均工资的对数,便于回归分析;作为因变量。
;
:工龄
;
;
;
;
2)分别作出y与各自变量之间的散点图,发现与x2非线性关系较为明显(下图所示),所以应该考虑为非线性模型,
data=xlsread(Adata.xls,2);
y=data(:,1);
x=data(:,2:8);
plot(x(:,2),y,r*)
title(lny vs x2)
3)相关性分析
data=xlsread(Adata.xls,2);
y=data(:,1);
x=data(:,2:8);
s=corrcoef(data);
xlswrite(coef.xls,s)
lny X1 X2 X3 X4 X5 X6 X7 1 0.266995 0.775291 0.286135 0.505526 0.277929 0.199178 0.489786 0.266995 1 0.160389 0.679446 0.312348 0.417621 -0.10498 0.316025 0.775291 0.160389 1 0.226096 0.103146 0.098854 0.151146 0.156321 0.286135 0.679446 0.226096 1 0.266937 0.213363 -0.27966 0.229535 0.505526 0.312348 0.103146 0.266937 1 0.412745 0.219762 0.855236 0.277929 0.417621 0.098854 0.213363 0.412745 1 -0.05307 0.423355 0.199178 -0.10498 0.151146 -0.27966 0.219762 -0.05307 1 0.255665 0.489786 0.316025 0.156321 0.229535 0.855236 0.423355 0.255665 1
相关系数表也提示y仅与x2,x4关系密切.与婚姻状况x1,x3关系不明显.
2、建模及简易求解(第1、3问)
以下考虑分别用多元线性回归模型、线性逐步回归模型、非线性模型分析,从中选择相对最优的模型。
1).多元线性回归结果
源程序:
data=xlsread(Adata.xls,2);
Y=data(:,1);
x=data(:,2:8);
X=[ones(90,1),x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
结果:
b(系数) =
3.6623 常数项
0.0044 x1
0.0016 x2
-0.0010 x3
0.1713 x4
0.0170 x5
-0.0012 x6
0.0143 x7
Bint(系数95%置信区间) =
3.5957 3.7289
-0.0828 0.0917
0.0014 0.0019
-0.0930 0.0910
0.0849 0.2577
-0.0536 0.0876
-0.0798 0.0773
-0.1254 0.1540
置信区间包含零点,可认为在95%置信度下,相应变量对y影响不显著,应该考虑改进模型。
stats (统计量)=
0.7852 (决定系数) 42.8304(F值) 0 (P值) 0.0193
关于异常值:
利用上述多元线性回归模型分析结果,继续做异常点分析,
rcoplot(r,rint)
发现5个异常点: 43 52 60 61 90
从原始数据中将其剔除后,重新做多元线性回归,
源程序:
data=xlsread(Adata.xls,4);
Y=data(:,1);
x=data(:,2:8);
X=[ones(85,1),x];
[b,bint,r,rint,stats]=regress(Y,X);
b,bint,stats
结果
b =
3.6502
0.0055
0.0017
-0.0282
0.1752
您可能关注的文档
- (超级)326远卓《珠海九丰战略定位及管理改善中期报告(下)》.ppt
- (地理专题系列)专题一 等值线图判读及地形剖面图绘制.ppt
- (翻译)运用全局优化法对液压支架中四杆机构分析.doc
- (看完)碳纳米管修饰碳纤维超微圆柱电极研制与应用.pdf
- (十二) 变量作用域和存储类型.doc
- (通过高性能计算曲型执行器最优设计.pdf
- (徐变)混凝土致裂应力与内外约束和徐变关系.pdf
- [名校联盟]广东省顺德容山中学高一地理课件:大气运动.ppt
- [原创]2012年 物理 《学业水平测试》 专题四 考点3 重力做功与重力势能 配套课件.ppt
- _11_6_特别重大坍塌事故矿区采场稳定性三维数值模拟分析.doc
- b0改性水性聚氨酯涂料合成与性能的研究.pdf
- Ba修饰Pd_Al2O3对苯酚液相原位加氢制环己酮反应催化性能.pdf
- Benard对流问题五模类Lorenz方程组动力学行为及数值模拟.pdf
- Bi_2O_3_TiO_2复合纳米颗粒可见光光催化性能_英文_.pdf
- BOX—COX变换在Mathcad上实现及在多元线性回归中应用.pdf
- Byqmji交通部公路监理工程师资格考试模拟试题及答案道路桥梁3.doc
- C1调制效应理论评述及影响因素.pdf
- C_N共掺杂纳米TiO_2制备及光催化制氢活性.pdf
- CA6140车床主轴机械加工工艺设计.doc
- CAMC—IP型二轴运动控制电路功能及应用.doc
文档评论(0)