第九讲 相关分析与回归分析..pptVIP

  • 1
  • 0
  • 约2.83千字
  • 约 20页
  • 2019-01-05 发布于湖北
  • 举报
第六章 回归和回归分析 6.1 相关分析概述 6.2 相关分析 6.3 多元线性回归 6.4 曲线回归 6.5 逐步回归 6.1 相关分析概述 1. 散点图 散点图是描述变量之间关系的一种直观方法。我们用坐标的横轴代表自变量X,纵轴代表因变量Y,每组数据(xi,yi)在坐标系中用一个点表示,由这些点形成的散点图描述了两个变量之间的大致关系,从中可以直观地看出变量之间的关系形态及关系强度。 图6-1 不同形态的散点图 (a) (b) (c) (d) 就两个变量而言,如果变量之间的关系近似地表现为一条直线,则称为线性相关,如图6-1(a)和(b);如果变量之间的关系近似地表现为一条曲线,则称为非线性相关或曲线相关;如图6-1(c);如果两个变量的观测点很分散,无任何规律,则表示变量之间没有相关关系,如图6-l(d)。 2. 相关系数 相关系数是对变量之间关系密切程度的度量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;总体相关系数的计算公式为: 其中COV(X,Y)为变量X和Y的协方差,D(X)和D(Y)分别为X和Y的方差。 若相关系数是根据样本数据计算的,则称为样本相关系数(简称为相关系数),记为r。样本相关系数的计算公式为: 一般情况下,总体相关系数ρ是未知的,我们通常是将样本相关系数r作为ρ的近似估计值。 相关系数r有如下性质: 1)相关系数的取值范围:–1 ≤ r ≤ 1,若0 r ≤ 1,表明X与Y之间存在正线性相关关系,若–1 ≤ r 0,表明X与Y之间存在负线性相关关系。 2)若r = 1,表明X与Y之间为完全正线性相关关系;若 r = –1,表明X与Y之间为完全负线性相关关系;若r = 0,说明二者之间不存在线性相关关系。 3)当–1 r 1时,为说明两个变量之间的线性关系的密切程度,通常将相关程度分为以下几种情况:当| r | ≥ 0.8时,可视为高度相关;0.5 ≤ | r | 0.8时,可视为中度相关;0.3 ≤ | r | 0.5时,视为低度相关;当| r | 0.3时,说明两个变量之间的相关程度极弱,可视为不相关。但这种解释必须建立在对相关系数进行显著性检验的基础之上。 3. 相关系数的显著性检验 相关系数的显著性检验也就是检验总体相关系数是否显著为0,通常采用费歇尔(Fisher)提出的t分布检验,该检验可以用于小样本,也可以用于大样本。检验的具体步骤如下: 1) 提出假设:假设样本是从一个不相关的总体中随机抽取的,即 H0:ρ = 0;H1:ρ ≠ 0 2) 由样本观测值计算检验统计量: 的观测值t0和衡量观测结果极端性的p值: p = P{| t | ≥ | t0 |} = 2P{t ≥ |t0|} 3) 进行决策:比较p和检验水平?作判断:p ?,拒绝原假设H0;p ? ?,不能拒绝原假设H0。 6.2 相关分析 1 简单相关 2 偏相关 3 复相关 1 简单相关 二、简单相关系数r的显著性测验 PLOT的用法 PLOT 纵轴变量 * 横轴变量 [= 变量][/选项]; 表 PLOT语句的选项 PLOT语句的注意事项 PLOT语句用以对两个变量绘制散点图,表达式中位置在前(在乘号“*”之前)的变量作为散点图的y轴,位置在后的变量作为散点图的x轴。 * * 相关分析的实质: 反映各变量之间相关密切程度。 简单相关:研究两变量直线相关的密切程度和性质,也称直线相关。 偏相关:排除其余的影响因子,求出x 与y的纯相关,这种相关称偏相关。 复相关:研究一个变量与一组变量之间的相关性关系。 典型相关:研究两组变量间的相关关系。 (Analysis of Correlation) 简单相关: 是对有联系的两类事物(x与y)表面关系密切程度的衡量。 (Simple Correlation) 一、简单相关系数 相关系数r(无单位)的取值: 即: 由d.f=n-2查出相关系数的临界值r0.05 、r0.01 (degree of freedom) SAS直接输出prob|r|概率值,记为α. 统计假设H0:总体相关系数ρ=0 若α 0.0

文档评论(0)

1亿VIP精品文档

相关文档