统计软件应用课程设计..docxVIP

下载本文档

23
0
约6.52千字
约 19页
2017-01-13 发布于重庆
举报
版权申诉

统计软件应用课程设计..docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

统计软件应用课程设计.

Monte Carlo 在线性回归中的简单应用班级：1324001姓名：徐萍萍学号：201320400118指导老师：闫霏霏电话号码：2016年4月17日摘要：本文针对确定运动员的耗氧量与其他一些因素的关系数据，在SAS中进行回归分析得到对数据拟合较好的线性模型。再用Monte Carlo随机过程产生残差项并代入线性方程中，分别假定残差项不符合均值为零、正态分布、异方差三大假设，从而检验回归理论。关键字：蒙特卡罗、多元线性回归、残差项基本假设问题重述：在运动生理学的研究中，为了确定运动员的耗氧量与其他一些因素的关系，在一个实验中对31个人测量了年龄（age），体重（weight），跑完1.5英里用的时间（runtime），静态时的心率（rstpulse）,跑动时的心率（runpulse）,跑步时的最大心率（maxpulse）,每公斤体重每分钟的耗氧量（oxy）。实测数据（oxy.txt）见下表，试以oxy为因变量，估计该变量对于问题中所有其他变量的直线回归方程。并用Monte Carlo验证回归理论中残差项三大基本假设。(数据在附录中)、基本理论一、蒙特卡罗方法㈠蒙特卡罗（Monte Carlo）方法概述蒙特卡罗方法又称统计模拟法、随机抽样技术，是一种随机模拟方法，以概率和统计理论方法为基础的一种计算方法，是使用随机数（或更常见的伪随机数）来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系，用电子计算机实现统计模拟或抽样，以获得问题的近似解。为象征性地表明这一方法的概率统计特征，故借用赌城蒙特卡罗命名。㈡蒙特卡罗方法的基本原理由概率定义知，某事件的概率可以用大量试验中该事件发生的频率来估算，当样本容量足够大时，可以认为该事件的发生频率即为其概率。因此，可以先对影响其可靠度的随机变量进行大量的随机抽样，然后把这些抽样值一组一组地代入功能函数式，确定结构是否失效，最后从中求得结构的失效概率。蒙特卡罗法正是基于此思路进行分析的。　设有统计独立的随机变量Xi(i=1，2，3，…，k)，其对应的概率密度函数分别为fx1，fx2，…，fxk，功能函数式为Z=g(x1，x2，…，xk)。首先根据各随机变量的相应分布，产生N组随机数x1，x2，…，xk值，计算功能函数值 Zi=g(x1，x2，…，xk)(i=1，2，…，N)，若其中有L组随机数对应的功能函数值Zi≤0，则当N→∞时，根据伯努利大数定理及正态随机变量的特性有：结构失效概率，可靠指标。㈢蒙特卡罗方法的收敛性设所求的量是随机变量的数学期望E(x)，那么Monte Carlo方法通常使用随机变量的简单子样的算术平均值，即作为所求量X的近似值。由柯尔莫哥罗夫（Kolmogorov）大数定理可知，即当N充分大时，有成立的概率等于1，亦即可以用作为所求量X的估计值。根据中心极限定理，如果随机变量的标准差不为零，那么Monte Carlo方法的误差为式中，为正态差，是与置信水平有关的常量。Monte Carlo方法的收敛速度的阶为，误差是由随机变量的标准差S和抽样次数N决定的。二、多元线性回归模型㈠多元线性回归模型的一般形式设随机变量y与一般变量的线性回归模型为：记为①式中，是P+1个未知参数，称为回归常数，…称为回归系数。y称为被解释变量（因变量），是P个可以精确测量并控制的一般变量，称为解释变量（自变量）。P=1时，①式即一元线性回归模型；P≧2时，我们就称①式为多元线性回归模型。是随机误差，与一元线性回归一样，对随机误差我们常规定：称为理论回归方程。对一个实际问题，如果我们获得n组观测数据，则线性回归模型①式可表示为：写成矩阵形式为：记位②式，式中 X是一个阶矩阵，称为回归设计矩阵或资料矩阵。在实验设计中X的元素是预先设定并可以控制的，人的主观因素可作用其中，因而称X为设计矩阵。㈡多元线性回归模型的基本假定回归方程①式有如下基本假定：⑴解释变量x1,x2,…,xp是确定性变量，不是随机变量，且要求rank(X)=p+1n.这里的rank(X)=p+1n，表明设计矩阵X中的自变量列之间不相关，样本量的个数应大于解释变量的个数，X是一满秩矩阵。⑵随机误差项具有零均值和等方差，即这个假定常称为高斯-马尔柯夫条件。，即假设观测值没有系统误差，随机误差项的平均值为零。随机误差项的协方差为零，表明随机误差项在不同的样本点之间是不相关的（在正态假定下即为独立的），不存在序列相关，并且有相同的精度。⑶正态分布的假设条件为：对于多元线性回归的矩阵模型②式，这个条件可表示为：第二章、模型建立一、SAS中线性回归过程这里在SAS软件中，对问题中数据（oxy.txt）做多元线性回归，运行程序如下：I：libname ep e:\saslx;run; data ep