第13章多元线性回归.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第13章 多元线性回归 多元线性回归模型(对总体而言) 为未知参数, 为随机误差项,反映其它未列入回归模型的变量对因变量的影响。 Y,X均为为列向量 关于多元线性回归模型的标准假设: 1. ,可推知, 该方程称为回归方程。 2. 对于所有的X,误差项 的方差 一样:即同方差假定。 3.误差项 独立。其协方差为零, 4.自变量是给定的变量,与误差项线性无关。 5.误差项 服从正态分布,从而说明Y服从正态分布 对于总体的多元线性回归模型,由于总体参数未知,我们只能利用样本数据进行估计,得到样本回归模型(对样本而言)。 分别为 的估计。 其中真实值与估计值之间的差距用e来表示: 是y的一个估计值。 其中, 多元回归模型的估计 最小二乘法:残差最小化,即令 最小 数据 估计的方程: 我们用矩阵的形式来表述以上模型 求估计值B 令 最小 为了指定最佳工作计划表,Butler运输公司的管理人员希望估计其司机每天行驶的时间。起初,管理人员认为行驶时间y与行驶的英里数x1关系密切。因此收集10项运输任务的样本数据,利用excel统计分析,输出结果为: 发现模型的拟合度较低,希望追加另一个变量以解释变差中的剩余部分。追加的第二个变量是运货次数x2。 通过excel统计分析,我们来看看,增加的变量是否有助于提高模型的解释度。 回归系数的解释 在多元回归情形下,回归系数的解释:当所有其它自变量均保持不变时,bi是因变量对应于自变量xi改变一个单位时,所作的改变的估计值。 多元判定系数 SST=SSR+SSE 当增加自变量个数后,SSE会减小,SSR会增大。需要调整。 模型的显著性检验 1. 整体显著性检验(test for overall significance) 原理:MSE给出了随机误差项方差的一个无偏估计量。如果H0: 成立,则有: MSR=SSR/(p+1-1)也为误差项方差的一个无偏估计,且MSR和MSE的值将很接近。否则,MSR将高估误差项方差,从而使MSR和MSE的比值较大。 F检验: 提出假设:H0: Ha:至少有一个参数不等于0. 检验的统计量:F=MSR/MSE 拒绝法则:若F 则拒绝H0。 我们对Butler运输公司的模型进行F检验: H0: Ha:参数至少有一个不等于0. 在H0为真的前提下,统计量F=MSR/MSE=32.9,F统计量服从自由度为(2,7)的F分布。 查表得, F9.55,则拒绝H0。(由P值也同样可以判断) 方差分析表:表中的k表示待估参数个数。 2. 单个参数显著性的t检验: 与一元回归模型一样,模型估计的参数 服从正态分布 构造统计量: 由于总体方差未知,我们同样用MSE来近似替代总体方差 此时的统计量用t替代: 这里有: X1= X2= T分布的构造特点为:X1/sqrt(x2/自由度) 检验的假设为: H0: ;Ha: 在H0为真的前提下,有检验统计量 服从自由度为(n-k)的t分布。 拒绝法则: 若|t|t(a/2,n-k),则拒绝H0 由软件统计结果得到, 对H0: 的检验,计算得到的t统计量为6.18,比较t(0.005,7),6.183.499,拒绝H0,认为 统计上显著性。 同理对 做显著性检验,得到相同的结果。 3. 多重共线性 多重共线性指:自变量之间存在相关关系。 多重共线性带来的问题: (1)系数估计可能有符号错误或估计不出来 (2)尽管回归关系的总显著性很强,但参数估计可能有较大的标准差,单个参数检验的显著性水平较低。不能通过检验。 (3)数据很小的变化会导致参数估计的很大变化。 检验多重共线性: 对于有两个自变量的情形,当他们的样本相关系数大于0.7或小于-0.7时,将有可能产生多重共线性。 克服多重共线性:合并有相关关系的自变量 多元回归模型的估计和预测 1.E(y)的点估计量和y的预测值 将自变量 的值代入估计方程,并利用相对应的值作为y的点估计。 Bulter的例子:问当行驶里程为100英里,运货次数

文档评论(0)

ranfand + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档