人教版·选修1-2§1.1.1对回归模型地统计检验.pptVIP

人教版·选修1-2§1.1.1对回归模型地统计检验.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
离差平方和的分解 (三个平方和的意义) 总偏差平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 样本决定系数 (判定系数 r2 ) 回归平方和占总离差平方和的比例 什么是回归分析? (内容) 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 * §1.1.2 对回归模型的统计检验 人教版·选修1-2 思考P5: 如何刻画预报变量(体重)的变化?这个变化在多大程度上 与解析变量(身高)有关?在多大程度上与随机误差有关? 假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重 将相同。在体重不受任何变量影响的假设下,设8名女大学生的体重都是她们 的平均值,即8个人的体重都为54.5kg。 54.5 54.5 54.5 54.5 54.5 54.5 54.5 54.5 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 54.5kg 在散点图中,所有的点应该落在同一条 水平直线上,但是观测到的数据并非如 此。这就意味着预报变量(体重)的值 受解析变量(身高)或随机误差的影响。 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 例如,编号为6的女大学生的体重并没有落在水平直线上,她的体重为61kg。 解析变量(身高)和随机误差共同把这名学生的体重从54.5kg“推”到了61kg, 相差6.5kg,所以6.5kg是解析变量和随机误差的组合效应。 编号为3的女大学生的体重并也没有落在水平直线上,她的体重为50kg。解析 变量(身高)和随机误差共同把这名学生的体重从50kg“推”到了54.5kg,相差-4.5kg, 这时解析变量和随机误差的组合效应为-4.5kg。 用这种方法可以对所有预报变量计算组合效应。 数学上,把每个效应(观测值减去总的平均值)的平方加起来,即用 表示总的效应,称为总偏差平方和。 在例1中,总偏差平方和为354。 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 那么,在这个总的效应(总偏差平方和)中,有多少来自于解析变量 (身高)?有多少来自于随机误差? 假设随机误差对体重没有影响,也就是说,体重仅受身高的影响,那么散点图 中所有的点将完全落在回归直线上。但是,在图中,数据点并没有完全落在回归 直线上。这些点散布在回归直线附近,所以一定是随机误差把这些点从回归 直线上“推”开了。 在例1中,残差平方和约为128.361。 因此,数据点和它在回归直线上相应位置的差异 是随机误差的效应, 称 为残差。 例如,编号为6的女大学生,计算随机误差的效应(残差)为: 对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号 称为残差平方和,它代表了随机误差的效应。 表示为: 由于解析变量和随机误差的总效应(总偏差平方和)为354,而随机误差的 效应为128.361,所以解析变量的效应为 解析变量和随机误差的总效应(总偏差平方和) =解析变量的效应(回归平方和)+随机误差的效应(残差平方和) 354-128.361=225.639 这个值称为回归平方和。 我们可以用相关指数R2来刻画回归的效果,其计算公式是 反映回归直线的拟合程度 取值范围在 [ 0 , 1 ] 之间 r2 ?1,说明回归方程拟合的越好;r2?0,说明回归方程拟合的越差 判定系数等于相关系数的平方,即r2=(r)2 我们可以用相关指数R2来刻画回归的效果,其计算公式是 显然,R2的值越大,说明残差平方和越小,也就是说模型拟合效果越好。 在线性回归模型中,R2表示解析变量对预报变量变化的贡献率。 R2越接近1,表示回归的效果越好(因为R2越接近1,表示解析变

文档评论(0)

feiyang66 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档