2015数学建模_统计预测分析报告.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
3. 样本容量问题 样本是一个重要的实际问题,模型依赖于实际样本。 获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。 最小样本容量:满足基本要求的样本容量 样本容量问题 (X`X)-1存在?| X`X |≠0 ? X`X 为k+1阶的满秩阵 R(AB) ≤ min(R(A),R(B)) R(X) ≥ k+1 因此,必须有n≥k+1,此为最小样本容量 ▲满足基本要求的样本容量 一般经验认为: n ≥ 30或者n ≥ 3(k+1)才能满足模型估计的基本要求。 n ≥ 3(k+1)时,t分布才稳定,检验才较为有效 4.3 ?多元线性回归模型的统计检验 回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归。 尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。 那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。 主要包括拟合优度检验、变量的显著性检验及模型整体的显著性检验。 1.拟合优度检验 (1) 总离差平方和的分解 Y X 0 * * * * * * * △ * * * * Y9 由回归方程解释的部分,表示解释变量X对Y的线性影响 残差项,表示回归方程不能解释的部分 总离差平方和(TSS) 回归平方和(ESS) 残差平方和(RSS) (1)总离差平方和的分解 ★★注意英文缩小的含义 TSS:Total Square Sum / 总离差平方和 RSS: Regression Square Sum / 回归平方和 Residual Square Sum / 残差平方和 ESS Error Square Sum / 误差平方和(残差平方和) Explain Square Sum / 解释平方和(回归平方和) 平方和分解的意义 TSS=RSS+ESS 被解释变量Y总的变动(差异)= 解释变量X引起的变动(差异) + 除X以外的因素引起的变动(差异) 如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。 (2)样本可决系数 样本可决系数是拟合优度评价的最重要指标,残差的标准差也能作为拟合优度评价的参考指标 样本可决系数(The coefficient of Determination)R2 随机项μ的方差σ2的最小二乘估计量 ★★相关系数 计算方法与样本决定系数一样 含义有所不同: 样本可决系数是判断回归方程与样本观测值拟合优度的一个数量指标,隐含的前提条件是X和Y具有因果关系 相关系数是判断两个随机变量线性相关的密切程度,不考虑因果关系。 (3)调整的可决系数(adjusted coefficient of detemination) 增加解释变量时,很可能增加R2,容易引起错觉,认为只要在回归模型中增加解释变量就可以了,因此考虑对R2进行修正 思考:调整的可决系数能否为负?如果为负,说明什么问题? ★★注意TSS、ESS、RSS的自由度 TSS(离差平方和): n-1 RSS(残差平方和):n-k-1 ESS(回归平方和):k = n-1 ★★赤池信息准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有赤池信息准则和施瓦茨准则 赤池信息准则的定义为: AIC = ln( e’e/n) +[2(k+1)]/n 施瓦茨准则的定义为: SC = ln( e’e/n) +(k/n)ln n 上面的两个准则均要求仅当所增加的解释变量能够减少AIC和SC的值时,才允许在模型中增加该解释变量 4.方程整体线性的显著性检验(F检验) 检验估计的回归方程作为一个整体的统计显著性 5.参数估计量的t检验 检验回归方程中每个解释变量的统计显著性 ★★参数的置信区间 容易推出:在(1-?)的置信水平下?i的置信区间是 其中,t?/2为显著性水平为? 、自由度为n-k-1的t分布的临界值。 ★★回归模型统计检验的步骤 (1) 查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步 查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。 ★★ 但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。 4.4 ????多元线性回归模型的预测 对于模型 给定样本以外的解释变量的观测值X0=(1,X01,X02,…,X0k)

文档评论(0)

南非的朋友 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档