《管理统计学实验教程》第12章相关分析和回归分析.ppt

《管理统计学实验教程》第12章相关分析和回归分析.ppt

统计量包括皮尔逊(Pearson)相关系数、斯皮尔曼(Spearman)和肯德尔(Kendall)秩相关系数,一般用符号来表示。相关系数具有一些特性: (1)它的取值极限在-1和+1之间,即之间。若0,表明X和Y完全正相关;若0,表明X和Y负相关;当时,表明X和Y没有线性相关关系;当时,表明X和Y完全线性相关。若=1,表明X和Y完全正相关;若=-1,表明X和Y完全负相关。 (2)它具有对称性,即X与Y之间的相关系数和Y与X之间的相关系数相同。 (3)如果X和Y统计上独立的,则它们之间的相关系数;但反过来,不等于说 X和Y是独立的。 (4)它仅是线性关联的一个度量,不能用于描述非线性关系。 (2)斯皮尔曼(Spearman)和肯德尔(Kendall)秩相关系数 用来反映两个序次或等级变量的相关程度。斯皮尔曼(Spearman)相关系数公式为 式中,、 分别是 的秩。 分别是变量 、 的平均值。 3、显著性检验 (1)皮尔逊(Pearson)相关系数假设检验 检验的原假设是总体相关系数为0,即相关系数不显著,在原假设为真的条件下,与样本相关系数r有关的统计量服从自由度为的T分布: (2)斯皮尔曼(Spearman)等级相关系数假设检验 实验一 【例12-1】 对某市的金融业和其生产总值的影响情况做相关性分析。 (参见数据文件:data12-1.sav) 实验步骤 第1步 分析:两变量都是定距变量,考虑用Pearson相关系数来衡量。 第2步 两变量的相关性分析 单击“分析→相关→双变量” 实验结果与分析 1、描述性统计表 计量经济学检验 残差的正态性检验。残差的正态性检验可以通过建立标准参差直方图检验。由于服从标准正态分布,所以应有近50%为正,50%的为负;68%的 落在-1与+ 1之间,96%的落在-2与+2之间。当样本容量较小时,在理论上应服从于自由度为的t分布。 残差的方差齐性检验。残差的方差齐性检验可以通过残差散点图来验证。以样本残差为纵坐标,以估计值为横坐标作图,如果观察点随机地散布在横轴的周围,就说明残差基本符合同方差性假设。当此假设被否定,残差出现了异方差的情况时,就需要先对原始数据进行适当的变量转换,再利用回归模型进行估计和预测,使方差趋于稳定。 残差的独立性检验。检验残差独立性的统计量称为DW统计量,其数学表达式为: DW统计量取值范围为: 若DW=2,表明相邻两点的残差项相互独立; 若 表明相邻两点的残差项正相关; 若 表明相邻两点的残差项负相关。 残差统计表 直方图和累积概率P-P图 从残差分布的直方图与附于其上的正态分布曲线的比较,可以观察出残 差分析的正态性。 同时,从观测量累积概率图也可以看出残差分布基本服从正态性。 1、基本概念 多元线性回归分析是指含有多个解释变量的线性回归模型,用于解释被解释变量与其他多个解释变量之间的线性关系。 2、模型的检验 (1)校正的可决系数 (2)多重共线性检验 多重共线性检验的统计量有容许度(Tolerance)和方差膨胀因子(VIF)两个,公式分别为 显而易见VIF为Tol的倒数,Tol的值越小,VIF的值越大,自变量与其他变量之间存在共线性的可能性越大。方差膨胀因子VIF的值越接近于1,解释变量之间的多重共线性越弱,如果值大于或等于10,说明一个解释变量与其他解释变量之间有严重的多重共线性。 实验内容 【例12-4】 为研究我国民航客运量的变化趋势及其成因,试以民航客运量做因变量,以国内生产总值、消费额、铁路客运量、民航航程里程为自变量,根据1990-2014年统计数据进行多元线性回归分析(参见数据文件:data12-4.sav ) 实验步骤 第1步 分析。 第2步 多元线性回归分析设置。 1、菜单选择 按“分析→回归→线性”顺序打开 。 2、“统计量”对话框设置 3、“图”对话框设置 4、“保存”对话框设置 5、“方法”对话框设置 实验结果与分析 1、模型汇总表 2、方差分析表 方差分析表最关注的是F统计量,它是回归方程显著性检验的重要依据。表12.9中,F检验统计量为806.226,相对应的显著性概率p为0.000小于显著性水平0.05,因此应拒绝回归方程显著性F检验的原假设,认为所有因变量综合起来对因变量有显著影响。 3、回归系数表 第

文档评论(0)

1亿VIP精品文档

相关文档