- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据分析方法》
课 程 实 验 报 告
1.实验内容
(1)掌握回归分析的思想和计算步骤;
(2) 编写程序完成回归分析的计算,包括后续的显著性检验、残差分析、Box-Cox变换等内容。
2. 模型建立与求解(数据结构与算法描述) 3.实验数据与实验结果
解:根据所建立的模型在MATLAB中输入程序(程序见附录)得到以下结果: (1)回归方程为:Y=3.4526+0.4960X1+0.0092X2
说明该化妆品的消量和该城市人群收入情况关系不大,轻微影响,与使用该化妆品的人数有关。
∧
σ2的无偏估计:σ2=4.7403 (2)方差分析表如下表: 方差来源
自由度
平方和 53845 56.883 53902
均方 26922 4.703
F值
p
回归(R) 2 误差(E) 12 总和(T) 14
56795
2.28
从分析表中可以看出:F值远大于p的值。所以回归关系显著。 复相关R2=0.9989,所以回归效果显著。
解:根据所建立的模型,在MATLAB中输入程序(程序见附录)得到如下结果: (1)回归方程为:Y=-57.9877+4.7082X1+0.3393X2
在MTLAB中计算学生化残差(见程序清单二),所得到的学生化残差r的值由残差可知得到的r的值在(-1,1)的概率为0.645,在(-1.5,1.5)的概率为0.871,在(-2,2)之间的概率为0.968.
而服从正态分布的随机变量取值在(-1,1)之间的概率为0.68,在(-1.5,1.5)之间的概率为0.87,在(-2.2)之间的概率为0.95,所以相差较大,所以残差分析不合理,需要对数据变换。
∧
取λ=0.6进行Box-Cox变换Y(λ)
?lnY,λ=0?
=?Yλ-1
,λ≠0?
?λ
在MATLAB中输入程序(见程序代码清单二)
取λ=0.6,所以得到r的值(r的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:β0=-11.7736β1=1.1478
β2=0.0969
拟合函数为:Y=-11.7736+1.1478X1+0.0969X2 通过F值,R值可以检验到,回归效果显著
(3)某医院为了了解病人对医院工作的满意程度Y和病人的年龄X1,病情的严重程度X2和病人的忧虑程度X3之间的关系,随机调查了该医院的23位病人,得数据如下表:
∧
(1) 拟合线性回归模型Y=β0+β1X1+β2X2+β3X3+ε,通过残差分析与考察
模型及有关误差分布正态性假定的合理性;
2
(2) 若(1)中模型合理,分别在(i)Rα(p),(ii)Cp,(iii)PRESSp准则下选择最
优回归方程,各准则下的选择结果是否一致?
(3) 对αE=αD=0.10,用逐步回归法选择最优回归方程,其结果和(2)中的
数否一致?
(4) 对选择的最优回归方程作残差分析,与(1)中的相应结果比较,有何变
化? 习题2.6
解:(1)回归参数的β的最小二乘估计为:β=(XTX)-1XTY。 在MATLAB中输入程序(见程序代码清单二)可得: β0=-57.9877,β1=4.7082, β2=0.3393
所以回归方程为: Y=-57.9877+4.7082X1+0.3393X2
对数据做Box-Cox变换,(由于λ的取值在能力范围不好确定,所以经测试,取λ=0.6进行Box-Cox变换Y(λ)
?lnY,λ=0
?
=?Yλ-1,λ≠0?
?λ
∧
∧
在MATLAB中输入程序(见程序代码清单二)
取λ=0.6,所以得到r的值(r的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为:β0=-11.7736β1=1.1478β2=0.0969
拟合函数为:Y=-11.7736+1.1478X1+0.0969X2
通过F值,R值可以检验到,回归效果显著
习题2.9
解:根据所建立的模型,在MATLAB中输入程序,得到以下结果:
(1) 所得到的回归方程为:Y=162.8759-1.2103X1-0.6659X2-8.610X3
(2) 所得到的学生化残差见附录,通过对残差的分析,很明显不符合正态分布所以(1)
中所建立的模型不合理。 ∧
4.程序代码清单:
习题2.4
x=[1 274 2450
1 180 3254
1 375 3802
1 205 2838
1 86 2347
1 265 3782
1 98 3008
1 330 2450
1 195 2137
1 53 2560
1 430 4020
1 372 4427
1 236 2660
1 157 2088
1 370 2605];
y=[162
120
223
131
67
169
8
您可能关注的文档
最近下载
- 装饰装修工程监理细则装饰装修工程监理细则.doc VIP
- 年产40万平石墨烯散热膜项目环评(新版环评)环境影响报告表.pdf VIP
- 中国共产党历史1921-2021(广州大学)学习通网课章节测试答案.docx VIP
- 氧化石墨烯制备关键技术成果转化项目环评资料环境影响.docx VIP
- 2025年风电场产业现状与发展前景趋势.docx VIP
- 二年级数学上册应用题专项练习(每日一练,共34份).pdf VIP
- 道路交通标志和标线 第3部分:道路交通标线.pdf VIP
- 数据要素白皮书(2024年).pdf VIP
- 2024大数据白皮书.docx VIP
- LEGO乐高积木拼砌说明书21319,中央咖啡厅,LEGO®Ideas(年份2019)安装指南_第1份共2份.pdf
原创力文档


文档评论(0)