8.直线回归分析.pptVIP

  1. 1、本文档共95页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
8.直线回归分析

在1926年美国经济学家乔治·泰勒(George Taylor)创造了裙摆指数理论 所谓裙摆理论,就是指在经济的繁荣程度和女性的裙摆长度成正比例关系。简单通俗的说就是:经济繁荣时代,女性的裙摆会越来越短;经济一旦进入衰退,短裙则随之变成长裙。 年轻女性通过裙摆的高度来反映她们的生活态度。经济繁荣,女性乐观而自信,愿意展示自己美好的身体,而自家庭预算中划分出添置一条迷你裙——彻底的奢侈品——的钱,不存在任何困难;经济不景气,女性失去了自由自在的心情,包裹式的长裙给她们以安全感,说到家庭预算,如果必须添置新衣,那只能是实用的,可以在很多场合出现的——长裙。 小腿一瞥会给人一种独立感和信心;扫帚裙子则是谦逊和朴素的迹象。 而现在,要在具有个性化特征的中国通过观察女性裙摆长度来判断股市更是难上加难,那些前卫的女孩你根本不知道她们穿的是什么,进一步说,对于好多前卫女生,你连她是男是女也分不清。 计算公式: 取值范围: 单位:相关系数无单位,回归系数有单位 * * 前面学习的t检验、方差分析、卡方检验、非参数检验仅仅涉及一个分析变量的关系,今天要学习两个变量之间的关系。 相关与回归是两个不同但有联系的问题,都是讨论两个变量之间的关系。 回归要找出定量关系,用一个变量来预测另一个变量。 我们要学习的是线性相关 * * * * * * * * * * * * * * * * * * * * * * * 回归方程的估计 原理:最小二乘法(least square method) 各实测点到直线的纵向距离平方之和达到最小 计算公式 其中 本例 故所求回归方程为: 直线回归的统计推断 样本回归系数b 总体回归系数β 对β的两种假设检验方法: 方差分析法 t检验法 方差分析法 总变异的分解 即: :总离均差平方和 (不考虑回归关系的总变异) :回归平方和(总变异中可以用回归关系所 解 释的部分。值越大,说明回归效果越好。) :残差平方和(总平方和中无法用回归关系解 释的部分—随机误差) 自由度的分解 构造F统计量 方差分析表 来源 平方和SS 自由度? 均方MS 统计量F 总 ?总=n-1 回归 ?回=1 MS回=SS回/1 MS回/MS残 残差 ?残=n-2 MS残=SS残/(n-2) 本例 1.建立检验假设,确定检验水准 2.计算检验统计量 3.确定P值,作出统计推断 P0.01,按照0.05检验水准拒绝H0。回归方程有统计学意义,可以认为腹腔内脂肪面积与腰围之间有直线回归关系。 t检验法 公式: 其中: 本例 查t界值表 ,得P0.001,结论与方差分析法一致 实际上:对同一资料作总体回归系数是否为0的假设检验,方差分析和t 检验是一致的。 总体回归系数的区间估计 本例: 决定系数(coefficient of determination) 反映了回归贡献的相对程度,即在因变量y的总变异中用y与x回归关系所能解释的比例。在实际应用中,常用决定系数来反映回归的实际效果。本例决定系数为0.581 直线回归分析的应用 因变量总体条件均数的置信区间估计 应变量个体y值的预测区间 总体条件均数的置信区间估计 点估计: 是在给定x=xp下的条件平均值的点估计 的1-α的置信区间估计 ???  公式为: 其中: 应变量个体y值的预测区间 对于给定的x=xp,y值的预测区间 计算公式为: 其中: 二者的区别(置信带和预测带) 直线回归分析需注意的问题 回归分析前应绘制散点图(必需有直线趋势时,才适宜作直线回归分析。应注意资料有无离群点(outlier)及离群点的处理。 模型假设条件的考察(残差图) 结果的解释及正确应用 反映自变量对应变量数量上影响大小的是回归系数 ,而非P值。 内插与外推 直线回归与直线相关分析的联系与区别 联系 对于服从双变量正态分布的同一组数据,既可作直线相关分析又可作直线回归分析,相关系数与回归系数正负号一致。本例:r=0.762 b=2.11 对于同一样本,相关系数与回归系数的假设检验等价 。tb=tr 对于服从双变量正态分布的同一组资料 用回归可以解释相关: 区别 资料要求:直线相关要求双变量正态分布,直线回归要求给定自变量值时,因变量服从正态分布 应用及意义:相关系数说明两变量间相互关系的方向与密切程度 ;回归系数说明两变量的数量依存关系 (2)计算检验统计量 (3)确定P值并作出统计推断 查t

您可能关注的文档

文档评论(0)

hello118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档