第七章相关与回归分析解析.ppt

学 习 目 标 1. 相关系数的分析方法 2. 一元线性回归的基本原理和最小二乘估计法 3. 回归直线的拟合优度 4. 回归方程的显著性检验 5. 利用回归方程进行估计和预测 7. 用 Excel 进行回归分析 变数间的关系 散点图 (例题分析) 【例】一大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来压力。为弄清楚不良贷款形成原因,希望利用银行业务有关数据做些分析,以找出控制不良贷款的办法。下面是该银行所属25家分行2002年的有关数据 散点图 (例题分析) 散点图 (例题分析) 相关关系的测定 相 关 系 数 (correlation coefficient) 1.对变量之间关系密切程度的度量 2.对两个变量之间线性相关程度的度量称为简单相关系数 3.若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 4.若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数 (取值及其意义) 1.r 的取值范围是 [-1, 1] 2.|r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 3.r = 0,不存在线性相关关系相关 4. -1?r0,为负相关 5.0r?1,为正相关 6.|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数 (取值及其意义) 相关系数 (例题分析) 用Excel计算相关系数 相关系数 (例题分析) 相关系数的显著性检验 1. 检验两个变量之间是否存在线性相关关系 2. 等价于对回归系数 b1的检验 3. 采用R.A.Fisher提出的 t 检验 4. 检验的步骤为 提出假设:H0:? ? ? ;H1: ? ? 0 例题分析 ? 对不良贷款与贷款余额之间的相关系数进行显著性检(??0.05) 1. 提出假设:H0:? ? ? ; H1:? ? 0 2. 计算检验的统计量 各相关系数检验的统计量 回归模型实例 什么是回归分析? (Regression) 1.从一组样本数据出发,确定变量之间的数学关系式 2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 二.一元线性回归模型 一元线性回归 1.涉及一个自变量的回归 2.因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 3.因变量与自变量之间的关系用线性方程来表示 回归模型 1.回答“变量之间是什么样的关系?” 2.方程中运用 ● 1 个因变量(响应变量) 被预测的变量 ● 1 个或多个自变量 (解释变量) 用于预测的变量 3.主要用于预测和估计 线性回归假设的图形表示 回归方程 1.描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 2.一元线性回归方程的形式如下 E( y ) = ?0+ ?1 x 估计的回归方程(样本回归方程) 二 . 参数的最小二乘估计 最小二乘估计 最小二乘估计 (图示) 最小二乘法 ( 和 的计算公式) ( 和 的计算公式) 估计方程的求法 (例题分析) 求不良贷款对贷款余额的回归方程 (例题分析) 不良贷款对贷款余额回归方程的图示 用Excel进行回归分析 第1步:选择“工具”下拉菜单 第2步:选择“数据分析”选项 第3步:在分析工具中选择“回归”,然后选择“确定” 第4步:当对话框出现时 在“Y值输入区域”方框内键入Y的数据区域 在“X值输入区域”方框内键入X的数据区域 在“置信度”选项中给出所需的数值 在“输出选项”中选择输出区域 在“残差”分析选项中选择所需的选项 1.回归直线的拟合优度 变 差 1.因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面 由于自变量 x 的取值不同造成的 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响 2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示 变差的分解 (图示) 离差平方和的分解 (三个平方和的关系) 离差平方和的分解 (三个平方和的意义) 1.总平方和(SST ) 反映因变量的 n 个观察值与其

文档评论(0)

1亿VIP精品文档

相关文档