- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实 验 报 告
课程名称 数学建模 年级 12 级 日期 5.19 姓 名叶美芳 学号 *******1235 班级 数学*班
实验名称 回归分析
一.实验目的及要求:
掌握回归分析的基本理论
会运用回归分析相关理论进行编程和解决实际问题二.实验内容:
背景:
由于有氧锻炼中,人体的耗氧能力是衡量人身体健康状况的重要指标,而耗氧能力(人体单位重量单位时间内最大的耗氧量)在日常生活中难以直接测量,故本文建立相关数学模型, 采用机理分析和回归分析以及数据拟合相结合的办法,以期望使普通大众能够方便快键地对自身身体状况有更为直接的了解,也能更加合理科学地锻炼。
题目:
习题 7:在有氧锻炼中人的耗氧能力 y (mL/(min·kg))是衡量身体状况的重要指标,它可能与以下因素有关:年龄 x1 ,体重 x2 (kg),1500m 跑的时间 x3 (min),静止时心跳速度 x4 (次/min),跑步后心速 x5 (次/min),对 24 名 40 至 57 岁的志愿者进行了测试,结果如下表 1.1(节选),
试建立耗氧能力 y 与诸因素的之间的回归模型。
表 1.1
序号
1
2
3
4
…
21
22
23
24
Y
44.6
45.3
54.3
59.6
…
39.4
46.1
45.4
54.7
X1
44
40
44
42
…
57
54
52
50
X2
89.5
75.1
85.8
68.2
…
73.4
79.4
76.3
70.9
X3
6.82
6.04
5.19
4.9
…
7.58
6.7
5.78
5.35
X4
62
62
45
40
…
58
62
48
48
X5
178
185
156
166
…
174
156
164
146
若中x ~ x
1 5
若中x ~ x
1 5
只许选择 1 个变量,最好的模型是什么?
只许选择 2 个变量,最好的模型是什么?
若不限制变量的个数,最好的模型是什么?
对最终模型观察残查,有无异常点,若有,剔除后如何?
做法 :
本题不同小问需要建立不同模型,由于专业知识所限,并且提供的数据较少,难以做出精确符合现实情况的模型,因此这里用最简单的线性回归法进行拟和模型基本形式如下:
事实上,中的项(高次项和交互项)对于本题目来讲意义不大,因为所给定的5 个自变量和因变量之间关系比较模糊,几个变量彼此之间的联系也很难说清,因此用自变量的一次线性拟和就足以适应本题的要求。但作为练习,还是将每种回归方法都使用到了,可以用于参考。具体采用的各个模型将在下面单独说明,这里不再重复。
程序
由于本题需要建立多组模型,并且要在不断的调试中发现最合理的,很多命令都要在这个过程中不断使用,这里仅仅给出使用的最基本的命令。
数据
clear
A=[…]; %数据矩阵,略n=24;
y=A(2,:); %提取各个数据x1=A(3,:);x2=A(4,:);x3=A(5,:);x4=A(6,:);x5=A(7,:);
绘制散点图(大致判断影响情况) for i=1:5 subplot(2,3,i),plot(A(i+2,:),y,+),grid
pause end pause
单参数回归(第一问)
X=[ones(n,1),x4]; %这里检验的是自变量x4,实际操作时要分别检验 x1~x5 [b,bint,r,rint,s]=regress(y,X); %回归分析程序(а=0.05)
b,bint,s, %输出回归系数估计值、置信区间、以及统计量
rcoplot(r,rint) %残差图
Polytool(x3,y,2) %检验一元多项式回归的结果,输出交互式画面双参数回归(第二问):用逐步回归法找出最合理的两个变量 X5=[x1,x2,x3,x4,x5];
stepwise(X5,y); %利用输出的交互式画面,可以选出最佳的两个变量XX=[x3,x1]; %当得到了最佳的两个变量后(这里假设是 x3\x1) rstool(XX,y,linear) %检验二元情况下的交互项和高次项
全部参数回归(第三问):
X5=[x1,x2,x3,x4,x5]; %仍然用逐步回归法找出最合理的组合方式stepwise(X5,y)
第五问要求对残差进行分析,并且剔除异常点,可以在该问得到最终模型后,采用 regress
得到的残差值和置信区间并根据其绘制残差图,然后再进行剔除操作重新检验。
运行结果及分析散点图
(1) (2) (3)
(4) (5)
从左上到右下的顺序为 x1~x5.可以由点的分布大致看出,除了x3 自变量呈现比较明显的负相关趋势以外,对于其他的各个自变量都难以直接观测出其对于因变量的影响。根据这种结果,可以假设自变量 x3(1500m 跑后心速)最直接的与锻炼耗氧能力相关,下面通过对
原创力文档


文档评论(0)