1.1___回归分析基本思想及其初步应用修改.ppt

1.1___回归分析基本思想及其初步应用修改.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
思考:相关关系与函数关系有怎样的不同? 函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系 产生随机误差e的原因是什么? 残差分析 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否是线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析. 0.382 -2.883 6.627 1.137 -4.618 2.419 2.627 -6.373 残差 59 43 61 64 54 50 57 48 体重/kg 170 155 165 175 170 157 165 165 身高/cm 8 7 6 5 4 3 2 1 编号 下表为女大学生身高和体重的原始数据以及相应的残差数据: ? e 以纵坐标为残差,横坐标为编号,作出图形(残差图)来分析残差特性. 由图可知,第1个样本点和第6个样本点的残差比较大,需要确认在采集这两个样本点的过程中是否有人为的错误.如果数据采集有错误,就予以纠正,然后重新利用线性回归模型拟合数据;如果数据采集没有错误,则需要寻找其他原因. 如何刻画模型拟合的精度? 相关指数: 在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方. R2取值越大,则残差平方和越小,即模型的拟合效果越好. R2=0.64,表明:“女大学生的身高解释了64%的体重变化”,或者说“女大学生的体重差异有64%是由身高引起的”. 解释 预报 1 问题四:结合例1思考:用回归方程预报体重时应注意什么? 1.回归方程只适用于我们所研究的样本的总体。 2.我们建立的回归方程一般都有时间性。 3.样本取值的范围会影响回归方程的适用范围。 4.不能期望回归方程得到的预报值就是预报变量的精确值。 涉及到统计的一些思想: 模型适用的总体;模型的时间性; 样本的取值范围对模型的影响;模型预报结果的正确理解。 误差与残差,这两个概念在某程度上具有很大的相似性,都是衡量不确定性的指标,可是两者又存在区别。 误差与测量有关,误差大小可以衡量测量的准确性,误差越大则表示测量越不准确。误差分为两类:系统误差与随机误差。其中,系统误差与测量方案有关,通过改进测量方案可以避免系统误差。随机误差与观测者,测量工具,被观测物体的性质有关,只能尽量减小,却不能避免。 残差――与预测有关,残差大小可以衡量预测的准确性。残差越大表示预测越不准确。残差与数据本身的分布特性,回归方程的选择有关。 0.98 指数函数模型 0.802 二次函数模型 0.7464 线性回归模型 相关指数R2 函数模型 上节例2中最好的模型是哪个? 显然,指数函数模型最好! 建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在线性关系); (3)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程y=bx+a); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等. 1)确定解释变量和预报变量; 2)画出散点图; 3)确定回归方程类型; 4)求出回归方程; 5)利用相关指数或残差进行分析. 建立回归模型的基本步骤 小 结 实际问题 样本分析 回归模型 抽样 回归分析 预报精度 预报 结束 题型三 残差分析 通过对残差图的分析,得出模型的拟合效果. 在7块形状、大小相同的并排试验田上进行施肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg): 例3 施肥量x/kg 15 20 25 30 35 40 45 水稻产量y/kg 330 345 365 405 445 450 455 (1)以施肥量x为解释变量,水稻产量y为预报变量,作出散点图; (2)求y与x之间的回归方程,并求施肥量为28 kg时水稻产量的预报值; (3)计算残差,并计算残差平方和; (4)求R2,并说明其含义. 【解】(1)散点图如图所示: (2)由散点图可以看出,样本点呈条状分布,施肥量和水稻产量有较好的线性相关关系,因此可以用线性回归方程近似刻画它们之间的关系。 【题后点评】在求回归方程时,先画散点图,看样本是否能很好地符合线性相关关系或进行相关性检验.相关指数R2表示解释变量对预报变量的贡

文档评论(0)

ygxt89 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档