统计软件应用课程设计..docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计软件应用课程设计.

Monte Carlo 在线性回归中的简单应用班级:1324001姓名:徐萍萍学号:201320400118指导老师:闫霏霏电话号码:2016年4月17日摘要:本文针对确定运动员的耗氧量与其他一些因素的关系数据,在SAS中进行回归分析得到对数据拟合较好的线性模型。再用Monte Carlo随机过程产生残差项并代入线性方程中,分别假定残差项不符合均值为零、正态分布、异方差三大假设,从而检验回归理论。关键字:蒙特卡罗、多元线性回归、残差项基本假设问题重述:在运动生理学的研究中,为了确定运动员的耗氧量与其他一些因素的关系,在一个实验中对31个人测量了年龄(age),体重(weight),跑完1.5英里用的时间(runtime),静态时的心率(rstpulse),跑动时的心率(runpulse),跑步时的最大心率(maxpulse),每公斤体重每分钟的耗氧量(oxy)。实测数据(oxy.txt)见下表,试以oxy为因变量,估计该变量对于问题中所有其他变量的直线回归方程。并用Monte Carlo验证回归理论中残差项三大基本假设。(数据在附录中)、基本理论一、蒙特卡罗方法㈠蒙特卡罗(Monte Carlo)方法概述 蒙特卡罗方法又称统计模拟法、随机抽样技术,是一种随机模拟方法,以概率和统计理论方法为基础的一种计算方法,是使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。为象征性地表明这一方法的概率统计特征,故借用赌城蒙特卡罗命名。㈡蒙特卡罗方法的基本原理 由概率定义知,某事件的概率可以用大量试验中该事件发生的频率来估算,当样本容量足够大时,可以认为该事件的发生频率即为其概率。因此,可以先对影响其可靠度的随机变量进行大量的随机抽样,然后把这些抽样值一组一组地代入功能函数式,确定结构是否失效,最后从中求得结构的失效概率。蒙特卡罗法正是基于此思路进行分析的。 设有统计独立的随机变量Xi(i=1,2,3,…,k),其对应的概率密度函数分别为fx1,fx2,…,fxk,功能函数式为Z=g(x1,x2,…,xk)。 首先根据各随机变量的相应分布,产生N组随机数x1,x2,…,xk值,计算功能函数值 Zi=g(x1,x2,…,xk)(i=1,2,…,N),若其中有L组随机数对应的功能函数值Zi≤0,则当N→∞时,根据伯努利大数定理及正态随机变量的特性有:结构失效概率,可靠指标。㈢蒙特卡罗方法的收敛性设所求的量是随机变量的数学期望E(x),那么Monte Carlo方法通常使用随机变量的简单子样的算术平均值,即 作为所求量X的近似值。由柯尔莫哥罗夫(Kolmogorov)大数定理可知,即当N充分大时,有成立的概率等于1,亦即可以用作为所求量X的估计值。根据中心极限定理,如果随机变量的标准差不为零,那么Monte Carlo方法的误差为式中,为正态差,是与置信水平有关的常量。Monte Carlo方法的收敛速度的阶为,误差是由随机变量的标准差S和抽样次数N决定的。二、多元线性回归模型㈠多元线性回归模型的一般形式 设随机变量y与一般变量的线性回归模型为: 记为①式中,是P+1个未知参数,称为回归常数,…称为回归系数。y称为被解释变量(因变量),是P个可以精确测量并控制的一般变量,称为解释变量(自变量)。P=1时,①式即一元线性回归模型;P≧2时,我们就称①式为多元线性回归模型。是随机误差,与一元线性回归一样,对随机误差我们常规定:称 为理论回归方程。 对一个实际问题,如果我们获得n组观测数据,则线性回归模型①式可表示为:写成矩阵形式为: 记位②式,式中 X是一个阶矩阵,称为回归设计矩阵或资料矩阵。在实验设计中X的元素是预先设定并可以控制的,人的主观因素可作用其中,因而称X为设计矩阵。㈡多元线性回归模型的基本假定 回归方程①式有如下基本假定:⑴解释变量x1,x2,…,xp是确定性变量,不是随机变量,且要求rank(X)=p+1n.这里的rank(X)=p+1n,表明设计矩阵X中的自变量列之间不相关,样本量的个数应大于解释变量的个数,X是一满秩矩阵。⑵随机误差项具有零均值和等方差,即 这个假定常称为高斯-马尔柯夫条件。,即假设观测值没有系统误差,随机误差项的平均值为零。随机误差项的协方差为零,表明随机误差项在不同的样本点之间是不相关的(在正态假定下即为独立的),不存在序列相关,并且有相同的精度。⑶正态分布的假设条件为:对于多元线性回归的矩阵模型②式,这个条件可表示为:第二章、模型建立一、SAS中线性回归过程 这里在SAS软件中,对问题中数据(oxy.txt)做多元线性回归,运行程序如下:I:libname ep e:\saslx;run; data ep

文档评论(0)

jiulama + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档