回归分析部分初步.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析部分初步

多元统计课程设计 之 回归分析 长春工业大学 线性回归模型 一元线性回归模型 多元线性回归模型 p=1时,先做散点图; p=2时,回归平面; p=3时,回归超平面,几何图形无法表示 回归模型的基本假设 1. 解释变量y为随机变量,而解释变量 为非随机变量,观测值 是常数。 2. Gauss-Markov条件(等方差及不相关假定条件) 回归模型的基本假设 3. 正态分布假设 即 4. 通常为了便于数学上的处理,还要求n p,即样本容量的个数要多于解释变量的个数。 对线性回归模型通常要研究的问题 1. 如何根据样本求出参数 及方差 估计; 2. 对回归方程及回归系数的种种假设进行检验; 3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。 正态假设下, 参数的最小二乘估计(OSLE) 与极大似然估计(MLE)一致,即若线性回归 模型为 ,其中 则有 ,可得 若称 为 的残差。则误差 项方差 的无偏估计为 回归分析步骤 step1:确定模型变量; step2:收集、整理统计数据; step3:确定理论回归模型的数学形式; step4:模型参数估计; step5:模型检验; step6:模型改进; step7:回归模型的运用。 确定模型变量 首先要根据所研究问题的目的设置因变量 y,然后再选取与y有统计关系的一些变量作为 自变量。 对一个具体的经济问题,当研究目的确定 之后,被解释变量容易确定,被解释变量一般 直接表达、刻画研究的目的。 而对被解释变量有影响的解释变量往往不 容易被确定。 一是由于认识有局限性,我们不可能完全 了解对被解释变量有重要影响的全部因素。 二是为了模型参数估计的有效性,设置的 解释变量之间应该是不相关的。 三是我们从经济关系角度考虑非常重要的 变量应该引进, 但在实际中并没有这样的统计 数据。 这一点在我国建立经济模型时经常会遇 到。这时可以考虑用相近的变量代替,或者由 其他几个指标复合成一个新的指标。 注: 1.不要认为一个回归模型中解释变量越多越好。 可能选取与问题无关的变量,也可能由于一 些变量具有较强相关性,他们所反映的信息 有较严重的重叠,即出现共线性问题。 另当 变量太多,计算工作量太大,计算误差积累 也大,估计出的模型参数精度自然不高。 2.回归变量一般一次并不能完全确定,通常要 经过反复试算,最终找出最合适的一些变量。 收集、整理统计数据 确定好回归模型的变量之后,就要对这些 变量收集、整理统计数据。 数据的收集是建立回归模型的重要一环, 是一项基础性工作,样本数据的质量如何,对 回归模型的水平有至关重要的影响。 常用的样本数据分为时间序列数据和横截面数据 时间序列数据——按时间顺序排列的统计数据。 对于时间序列数据要注意数据的可比性和数 据的统计口径问题。 时间序列数据容易产生模型中随机误差项的 序列相关,这是因为许多经济变量的前后期之间 总是有关联的。 对于具有随机误差项序列相关的情况,要通 过对数据的某种计算整理来消除序列相关性,最 常用的处理方法是差分法。 横截面数据——在同一时间截面上的统计数据。 用横截面数据作为样本时,容易产生异方 差性。 对于具有异方差性的建模问题,数据整理 就要注意消除异方差性,这常与模型参数估计 方法结合起来考虑。 时间序列结合横截面数据形成面板数据, 由协 整分析专门处理 样本容量的选择 无论是时间序列数据还是横截面数据,样 本容量的多少一般要与设置的解释变量数目相 配套。通常为了使模型的参数估计更有效,要 求样本容量n大于解释变量的个数p。当np 时,普通的OLSE方法失效。 n与p的比例 据英国统计学家M.Kendall,n应是p的10 倍。这有时很难做到,但在收集数据时,应尽 可能多收集一些样本数据。 统计数据的整理 统计数据的整理中不仅要把一些变量数据 进行折算、差分,甚至把数据对数化、标准化 等

文档评论(0)

ipad0d + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档