【精品】统计学第11章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第11章 相关与回归分析 11.1 变量间关系的度量 11.1.1 变量间的关系 函数关系 1、是一一对应的确定关系 2、设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完 全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相 应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自 变量,y 称为因变量 3、各观测点落在一条线上 函数关系(几个例子) 相关关系 1、变量间关系不能用函数关系精确表达 2、一个变量的取值不能由另一个变量唯一确定 3、当变量 x 取某个值时,变量 y 的取值可能有几个 4、各观测点分布在直线周围 相关关系(几个例子) 相关关系的类型 11.1.2 相关关系的描述与测度 相关分析要解决的问题 变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样本所反映的变量之间的关系能否代表总体变量之间的关系? 1.散点图(scatter diagram) 例11.6 表11-1 图11-2 图11-3 图11-4 图11-5 例11.6 从各散点图可以看出,不良贷款与贷款余额、应收贷款、贷款项目个数、固定资产投资额之间都具有一定的线性关系。但从各散点的分布情况看,不良贷款与贷款余额的线性关系比较密切,而与固定资产投资额之间的关系最不密切。 2.相关系数(correlation coefficient) 样本相关系数计算 相关系数的取值范围及意义 相关系数的性质 性质1:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy= ryx 性质2:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小 性质3:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意味着, r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系 性质4:r虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系 相关系数的经验解释 1、 |r|?0.8时,可视为两个变量之间高度相关 2、0.5?|r|0.8时,可视为中度相关 3、0.3?|r|0.5时,视为低度相关 4、|r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关 5、上述解释必须建立在对相关系数的显著性进行检验的基础之上 11.1.3 相关系数的显著性检验 例 11.8 表11-3 11.2 一元线性回归 什么是回归分析? 1、从一组样本数据出发,确定变量之间的数学关系式 2、对这些关系式的可信程度进行各种统计检验,并从影响 某一特定变量的诸多变量中找出哪些变量的影响显著,哪 些不显著 3、利用所求的关系式,根据一个或几个变量的取值来预测 或控制另一个特定变量的取值,并给出这种预测或控制的 精确程度 回归分析与相关分析的区别 回归模型的类型示意图 一元线性回归 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量,用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量,用x表示 因变量与自变量之间的关系用一条线性方程来表示 回归模型 1、回答“变量之间是什么样的关系?” 2、方程中运用 1 个数值型因变量(响应变量) 被预测的变量 1 个或多个数值型或分类型自变量 (解释变量) 用于预测的变量 3、主要用于预测和估计 11.2.1 一元线性回归模型 1.回归模型(regression model) 一元线性回归模型的基本假定 2.回归方程(regression equation) 3.估计的回归方程(estimated regression equation) 最小化图 续 图11-8 用Excel进行回归分析 图11-8 表11-4 11.2.3 回归直线的拟合优度 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示 误差的分解(图示) 离差平方和的分解 (三个平方和的关系) 离差平方和的分解 (三个平方和的意义) 总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 残差平方和(SSE) 反映除 x 以外的其他因素对 y

文档评论(0)

如果.可以. + 关注
官方认证
文档贡献者

坚持分享有价值的资源!

认证主体汉中恒朱网络技术有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91610726MA6YWAFG7U

1亿VIP精品文档

相关文档