- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章数理统计的基本概念
* (2)模型修正 如果发现线性假设是不适合, 那么就需要修改模型. 在目前的回归分析的知识水平下, 不一定能很好地修改误差方差不相等这类模型, 但可以尝试响应变量的数据变换。 * 用变换后的数据, 求出线性回归方程, 求出残差, 并画出以拟合值为横座标的残差图, 如果这里残差图已经没有任何规律, 那么说明这种变换是适合的. * * 三、误差的独立性诊断 在不少有关时间问题中,观测值往往呈相关的趋势。如河流的水位总有一个变化过程,当一场暴雨使河流水位上涨后往往需要几天才能使水位降低,因而当我们逐日测定河流最高水位时,相邻两天的观测间就不一定独立。 * (1)模型诊断 常用的残差图是以“时间”或“序号”为横座标的残差图. 相关性大约有二类. * 一类是正相关, 随机误差之间具有正相关的话,那么残差图中残差“符号”会出现“集团性”的趋势,即连续有一段时间内残差均为 “正号”, 然后又一段时间内残差均为“负号” 另一类是负相关, 此时,残差的符号改变非常频繁,大致有正负相间的趋势. * 残差图 * 残差图 * (2)模型修改 * * * 四、误差的正态性诊断 我们可采用卡方拟合检验对残差进行正态性的检验, 也可以用残差画一下直方图, 直观地判断残差量是不是具有正态性. 如果模型的误差不满足正态性时, 一般可以作Box-Cox变换, 这部分的内容这里不详细介绍, 有兴趣的同学可以参考有关的回归分析的参考文献. * * * * * * * * * * * * * * 因此,根据观测结果,点预测为 * * * * * Excel只能输出预测值,无法输出预测区间. 预测区间计算如下: 上例中x值置于B2:B17,y值置于C2:C17, 在Excel第18行,B18,C18,D18,E18,F18,G18分别为 5 2.0342 22.313 299.723 4719.438 2.145 * 5 2.0342 22.313 299.723 4719.438 2.145 * 例 合金钢的强度y与钢材中碳的含量x有密切关系。为了冶炼出符合要求强度的钢常常通过控制钢水中的碳含量来达到目的,为此需要了解y与x之间的关系。其中x:碳含量(%) y:钢的强度(kg/mm2)数据见右表: y x x^2 40.5 0.03 0.0009 39.5 0.04 0.0016 41 0.05 0.0025 41.5 0.07 0.0049 43 0.09 0.0081 42 0.1 0.01 45 0.12 0.0144 47.5 0.15 0.0225 53 0.17 0.0289 56 0.2 0.04 * (1)画出散点图; (2)设μ(x)=α+βx,求α,β的估计; (3)求误差方差的估计,画出残差图; (4)检验回归系数β是否为零(取α=0.05); (5)求回归系数β的95%置信区间; (6)求在x=0.06点,回归函数的点估计和95%置信区间; (7)求在x=0.06点,Y的点预测和95%区间预测。 (8) 模型还可以改进吗? * (1)合金钢的强度y与钢材中碳的含量x的散点图 * 方差分析 df SS MS F Significance F 回归 1 255.4116 255.4116 74.33289 2.54E-05 残差 8 27.48841 3.436051 显著 总计 9 282.9 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 35.4506 1.24292 28.5222 2.47E-09 显著 32.5844 38.3168 X Var. 1 92.6411 10.7452 8.62165 2.54E-05 显著 67.8627 117.420 * * * 显著水平为0.05 * * 方差分析 df SS MS F Significance F 回归分析 2 276.3151 138.1576 146.8669 1.92E-06 残差 7 6.584894 0.940699 显著 总计 9 282.9 Coefficients 标准误差 t Stat P-value Lower 95% Upper 95% Intercept 40.644 1.27932 31.7699 7.91E-09 37.6188 43.6691 X Var. 1 -30.483 26.7175 -1.14095 0.29142 -93.66 32.6935 X Var. 2 550.475 116.776 4.71394 0.00217 274.344 826.606 不显著 * 方差分析 df SS MS F S
文档评论(0)