- 10
- 0
- 约 23页
- 2018-04-01 发布于重庆
- 举报
SAS学习系列21相关分析
21. 相关分析
相关分析和回归分析是研究变量与变量间相互关系的重要方法。相关分析是研究两个或两组变量之间的线性相关情况,回归分析是拟合出变量间的表达式关系。
(一)Pearson直线相关
一、适用于两个变量均为服从正态分布,每对数据对应的点在直角坐标系中(即散点图)呈现直线趋势。
做相关分析时,要注意剔除异常值;相关关系不一定是因果关系。
二、用相关系数r∈[-1,1]来表示相关程度的大小:
r0: 正相关;r0: 负相关;r=0: 不相关;
r=1: 完全正相关;r=-1: 完全负相关。
相关程度的判断标准:看相关系数的平方r2,若r20.5,结果无实际价值。
注:相关系数只是刻画直线相关(Y=X2相关系数≠1)。
三、假设检验
1. H0: 总体相关系数ρ=0;H1: ρ≠0;
计算r值,P值,若P值≤α,则在显著水平α下拒绝H0;
2. 若H0成立,从ρ=0的总体中抽样,所得到的样本相关系数 r 呈对称分布(近似正态分布),此时可用 t 检验。
3. 必要时对相关系数做区间估计
从相关系数ρ≠0的总体中抽样,样本相关系数的分布是偏态的。用Z变换后,服从某种正态分布,估计z,再变换回r.
(二)Spearman等级相关,也称Spearman秩相关
对于不符合正态分布的资料,不用原始数据计算相关系数,而是将原始观察值由小到大编秩,然后根据秩次来计算
原创力文档

文档评论(0)