第6章 相关与回归分析5.5.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 相关与回归分析5.5

第6章 相关与回归分析 6.1 相关分析 6.2 一元线性回归 相关分析(correlation analysis)和回归分析(regression analysis)有什么用? 一个国家香烟的消费量与癌症的发病率有关系吗?父母的身高是否影响其子女的身高?公司股票的市盈率与老总的薪酬有关联吗?接受高学历教育的人是否比低学历的人有更高的薪水?……现实世界中存在着大量诸如此类的问题,用统计语言来概况,就是两个或者更多个变量之间,是否存在相互关联?进而,存在相关关系的变量间又是如何相互影响的? 相关分析(correlation analysis)和回归分析(regression analysis)可以用来回答这类问题,它们是研究现象之间相互关系的两种基本方法。本章介绍这两种方法的理论与应用。 6.1.1 变量间的关系 当一个变量取一定数值时,另一个变量有确定值与之相对应,这种关系称为函数关系。 当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化,这种关系称为相关关系。 对相关关系的分析是统计学的重要研究内容。 主要研究方法:相关分析和与回归分析。 函数关系 1.设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 2. 是一一对应的确定关系 3. 各观测点落在一条线上 函数关系 (几个例子) 相关关系 (correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 相关关系 (几个例子) 相关分析与回归分析 相关分析(Correlation Analysis)研究变量之间相关的方向和相关的程度,但无法给出变量间相互关系的具体形式,因而无法从一个变量推测另一个变量。 补充:相关关系的分类 (一)按现象之间相关关系的方向划分 1.正相关:是当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。 2.负相关:是当一个现象的数量由小变大,而另一个现象的数量相反地由大变小,这种相关称为负相关。 (二)? 按现象之间相关关系的程度分 1.完全相关:当一种现象的数量变化完全由另一个现象的数量变化所确定时,即相关关系已经转化为函数关系,称这两种现象间的关系为完全相关。 2.完全不相关:当两个现象彼此互不影响,其数量变化各自独立时,称为不相关现象。 3.不完全相关:两个现象之间的关系介于完全相关和不相关之间,称为不完全相关,一般的相关现象都是指这种不完全相关。如人的身高和体重之间的关系。 (三)按现象之间相关的形式分 1.线性相关:当两种相关现象之间的关系大致呈现为直线关系时,称之为线性相关,即直线相关。 2.非线性相关:如果两种相关现象之间,并不表现为直线的关系,而是近似于某种曲线方程的关系,则这种相关关系称为非线性相关,即曲线相关。 (一)相关图 相关图是以直角坐标系的横轴代表自变量,纵轴代表因变量,将两个变量间相对应的变量值用坐标点的形式描绘出来,用来反映两变量之间相关关系的图形,又称散点图或散布图或相关点图。 散点图 (scatter diagram) 散点图 (例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,管理者希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 (二)相关系数 (correlation coefficient) 定义:度量变量之间关系强度的一个统计量 对两个变量之间线性相关强度的度量称为简单相关系数 衡量两个定量变量之间线性相关程度的常用指标是皮尔逊( Pearson)相关系数。 通常以ρ表示总体的相关系数,以r表示样本的相关系数。 相关系数 (例题分析) ?用Excel计算相关系数 相关系数的性质 性质1:r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越强;|r|越趋于0表示关系越弱 相关系数的性质 性质

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档