网站大量收购独家精品文档,联系QQ:2885784924

《商务统计学》简单相关和回归分析.pptVIP

《商务统计学》简单相关和回归分析.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共143页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
类似于因变量新值的平均值的区间预测,当 偏离 的程度越大, 的杠杆值 就会越大, 的个别值预测区间宽度 就会越宽,也就是说 离 越远, 的个别值的区间预测精度越低。 * 当给定置信度后,可以发现两种预测区间的上下界都是关于自变量新值 的函数,因此我们可以在直角坐标系上同时画出给定置信度为95%时,两种预测区间上下界的曲线。 由图8-7可以看出,无论自变量取何值,个别值的预测区间都要比均值的预测区间宽。造成这种情况的原因是:在进行个别值的区间预测时,由于要预测的对 * 象 自身存在随机性,预测区间要以 的概率包含 ,区间宽度就会因为 的随机性而变宽,而均值的预测区间的预测对象 是一个常数。 * 此外,两种预测区间的上下限都对称地落在样本回归直线两边,弯曲成中间小两头大的喇叭形(图中可能不是非常明显,如果置信度取99%会更明显一些),这验证了我们之前所讲的, 离 越远,两种区间预测的精度都会越低。也就是说,用回归模型进行预测时, 的取值不宜离开 太远,否则预测精度将会降低,有可能使预测失效。 * 如果在预测时,自变量的取值在建模时样本 的取值范围内,这种预测称之为样本内预测,或内插预测。相反地,如果预测的自变量的取值在建模时样本 的取值范围外时,则称之为样本外预测,或外推预测。对于外推预测,由于自变量的取值偏离 较大,预测的误差可能会较大。所以在实际应用中,用估计的回归方程做外推预测时一定要谨慎。 * 8.8 案例分析 某保险公司想要确定居民火灾的损失数额与火灾发生地距最近的消防站的距离之间的相关关系,选取某个地区最近发生的15起火灾作为样本,表8-6给出了每一起火灾的损失数额及火灾发生地距最近的消防站的距离。 * 残差平方和SSE除以它的自由度( )为均方误差MSE。定义回归平方和SSR除以它的自由度为均方回归(mean square regression,MSR),其自由度为自变量的个数,在一元线性回归模型中只有一个自变量,因此SSR的自由度为1。 * 可以证明,当原假设 成立时, 两者相互独立 因此构造检验统计量: * F检验统计量还可以写成: 在简单线性回归模型里,F检验统计量是t检验统计量的平方,这也验证了F检验和t检验本质上是一样的说法。 * 当原假设 成立时,F统计量服从自由度为( )的F分布,给定显著性水平 ,临界值为 ,根据样本数据计算检验统计量的值 ,与临界值做比较,若 ,则拒绝原假设 ,认为自变量与因变量之间的线性关系显著;若 ,则不能拒绝原假设 ,认为自变量与因变量之间的线性关系不显著。 * 在实际应用中,仍然可以比较软件计算出的 值和显著性水平 。当 值小于显著性水平时,拒绝原假设,认为自变量与因变量之间的线性关系显著。 我们也可以通过方差分析表(ANOVA table)构造和计算F统计量,见表8-4所示。 * 对于比萨店的例子,其简单线性回归模型的ANOVA表如表8-5所示。 * 由上表,F检验统计量的值为74.25,取显著性水平 ,分子自由度为1,分母自由度为 ,临界值为 ,则 ,拒绝原假设,认为自变量学生人数( )与因变量季度销售收入( )之间的线性关系显著。此外,F检验的 值远小于显著性水平0.01,从而拒绝 ,认为自变量与因变量之间存在显著的线性回归关系。 * 8.6 残差分析 8.2.2中关于误差项的基本假定在显著性检验和预测中都起着重要作用,如果实际模型的误差项不完全满足基本假定,那么可能会造成显著性检验失效或者预测误差增大等不良影响。有的时候即使模型通过了显著性检验,也不能保证模型正确拟合了数据或者误差项完全满足假定。 * 为了保证模型的准确性和可靠性,在利用回归方程做分析和预测之前,需要利用残差图来诊断回归效果和样本数据质量,判断是否需要对模型进行进一步的修正。 对于第 个样本,残差为 ,是实际观测值与回归方程给出的拟合值之差。误差项为 ,我们 * 通过比较两个表达式正确区分二者。残差 可以看作是误差项 的估计。 在绘制残差图之前,先回顾一下关于误差项的假定。 1. 误差项的期望值为零; 2. 误差项的方差为常数; 3. 误差项之间不相关; 4. 误差项服从正态分布。 * 以残差为纵轴,自变量 或者

文档评论(0)

ning2021 + 关注
实名认证
文档贡献者

中医资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年05月10日上传了中医资格证

1亿VIP精品文档

相关文档