st-第6章相关与回归分解析.ppt

第 6 章 相关与回归分析 6.1 变量间关系的度量 6.2 一元线性回归 学习目标 相关关系的分析 参数的最小二乘估计 回归直线的拟合优度 回归方程的显著性检验 利用回归方程进行预测 用 Excel 进行回归 6.1.1 变量间的关系 函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 相关关系 (correlation) 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值对应着一个分布 各观测点分布在直线周围 6.1.2 相关关系的描述与测度 散点图 (scatter diagram) 用散点图描述变量间的关系 (例题分析) 【例6.6】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图 (例题分析) 相关系数 (correlation coefficient) 度量变量之间线性关系强度的一个统计量 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为 r 也称为Pearson相关系数 (Pearson’s correlation coefficient) 样本相关系数的计算公式 相关系数 (例题分析) 相关系数的性质 性质1:r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越强;|r|越趋于0表示关系越弱 相关系数的性质 性质2:r具有对称性。即x与y之间的相关系数和y与x之间 的相关系数相等,即rxy= ryx 性质3:r数值大小与x和y原点及尺度无关,即改变x和y的 数据原点及计量尺度,并不改变r数值大小 性质4:仅仅是x与y之间线性关系的一个度量,它不能用 于描述非线性关系。这意为着, r=0只表示两个 变量之间不存在线性相关关系,并不说明变量之 间没有任何关系 性质5:r虽然是两个变量之间线性关系的一个度量,却不 一定意味着x与y一定有因果关系 相关系数的经验解释 |r|?0.8时,可视为两个变量之间高度相关 0.5?|r|0.8时,可视为中度相关 0.3?|r|0.5时,视为低度相关 |r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关 上述解释必须建立在对相关系数的显著性进行检验的基础之上 6.1.3 相关系数的显著性检验 相关系数的显著性检验 (检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:? ? ? ;H1:? ? 0 计算检验的统计量 用Excel中的【TDIST】函数得双尾计算P值,并于显著性水平?比较,并作出决策 若P?,拒绝H0 相关系数的显著性检验 (例题分析) 【例6.8】 对不良贷款与贷款余额之间的相关系数进行显著性检(??0.05) 提出假设:H0:? ? ? ;H1:? ? 0 计算检验的统计量 相关系数的显著性检验 (例题分析) 各相关系数检验的统计量 6.2.1 一元线性回归模型 什么是回归分析? (regression analysis) 重点考察一个特定的变量(因变量),而把其他变量(自变量)看作是影响这一变量的因素,并通过适当的数学模型将变量间的关系表达出来 利用样本数据建立模型的估计方程 对模型进行显著性检验 进而通过一个或几个自变量的取值来估计或预测因变量的取值 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 相关分析主要是描述两个

文档评论(0)

1亿VIP精品文档

相关文档