网站大量收购独家精品文档,联系QQ:2885784924

选修1-2,回归分析课件.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
选修1-2,回归分析课件

必修3回顾 * 统计的步骤 确定对象 收集数据 数据分析 抽样方法 简单随机抽样 系统抽样 分层抽样 直方图 统计图表 条形图 折线图 茎叶图 用样本估计总体 用样本频率分布估计总体分布 用样本的数字特征估计总体的数字特征 两 个 变 量 的 关 系 相关关系 函数关系 线性相关 非线性相关 现实生活中两个变量间的关系有哪些呢? 对于具有相关关系的两个变量用什么方法来研究呢? 回归分析 回归分析的基本步骤: 画散点图 求回归方程 预报、决策 对具有线性相关的两个变量,我们可以用最小二乘法来求它的线性回归方程: 怎样描述两个变量之间的线性相关关系的强弱? 答:用相关系数r来衡量。 说明:①r0(两个变量)正相关,r0 负相关; ②︱r︱接近1表明相关性强,︱r︱接近0表明 两变量几乎不相关; ③ ︱r︱0.75时表示有很强的相关关系。 用下面的线性回归模型:y=bx+a+e 解释更客观。 e表示随机误差; a、b是模型的未知参数。 解释变量x 随机误差e 预报变量y 就例1而言,随机误差项e产生的原因是什么? 用线性回归方程y=bx+a进行回归分析会有误差吗?怎样体现误差产生的影响? 如:一位女大学生若其体重不受身高、随机误差的影响其体重应为54.5(平均值)公斤,但她的实际体重为61公斤,这说明什么? 说明体重受到身高、随机误差的双重影响, 这时解释变量和随机误差的组合效应是-6.5。 问题:如何刻画预报变量(体重)在多大程度上与解释变量(身高)、随机误差有关? 我们把每个“观测值减去总平均值的平方和”称 --总偏差平方和 它刻画了:解释变量、随机误差的效应总和 总偏差平方和= 如例1中的总偏差平方和为354 残差平方和----刻划随机误差效应 残差平方和= 残差= 问题: 那么“总偏差平方和”中又有多少来自于 随机误差? 观测值和它在回归直线上相应位置的差异叫: 回归平方和----反映解释变量的效应 回归平方和 残差平方和 总偏差平方和 例1的解释变量的效应为354-128.361=225.639 用什么来刻划回归的效果? 用相关指数R2 作用:R2越大--残差平方和越小--模型的拟合效果越好!反之相反。 1.00 354 (总偏差平方和) 总偏差 0.36 128.361 (残差平方和) 随机误差 0.64 225.639 (回归平方和) 解释变量 比例 平方和 来源 怎样判断模型的拟合效果?---用残差判断 判断原始数据中是否存在可疑数据--残差分析 进行残差分析的手段有哪些? 1.表格分析;2.画残差图 用身高预报体重时须注意下面问题: 1.适用范围;2.适用时间;3.样本选取影响方程适用范围;4:预报值是预报变量可能值的平均值 建立回归方程的步骤: 确立研究对象 画散点图 由经验确定回归方程类型 按规律估计a、b 分析残差图是否异常 *

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档