第七章 回归分析(一).ppt

第七章 回归分析(一)

第七章 回归分析 第一节 相关分析 第二节 一元线性回归 第三节 多元线性回归 第四节 回归诊断 第一节 相关分析 两变量相关分析的基本思想 运用数学方法研究两个变量之间的密切程度。 相关分析统计量 Pearson相关系数(线性相关程度) Spearman和Kendall相关系数 当数据不满足正态分布的条件时用 3.偏相关系数 第一节 相关分析 一、用insight制作散点图和计算相关系数 (一)散点图 制作数据集class中变量weight和height的散 点图。 1、analyze = scatter plot 2、weight = Y,height = X 3、OK (edit = windows = tools) 第一节 相关分析 制作散点图矩阵 若要考察多个变量之间的联系,制作它们间 的散点图阵是有用的。例如要建立数据集salary 中变量salary、salbegin、age、prevexp间的散点图。 选: 1、analyze = scatter plot (Y X) 2、将 salary、salbegin、age、prevexp =Y salary、salbegin、age、prevexp =X 3、OK 第一节 相关分析 (二)计算相关系数 1、analyze = multivariate(Y) 2、 educ、jobcat、salbegin、age、prevexp =Y salary、salbegin =X 3、OK 为了得到检验相关系数是否为零的原假设的p值,可选:tables = corr p-values 第一节 相关分析 对数据集salary中的已经计算相关的变 量生成95%预测值置信椭圆。选: curves = confidence ellipse = prediction:95% 结果显示,椭圆被拉得越长相关性越强。 第一节 相关分析 偏相关系数的计算 1、analyze = multivariate(Y) 2、 educ、jobcat=partial, salary =X salbegin=Y 3、OK 第一节 相关分析 二、用分析员应用计算相关系数 statistics = descriptive = correlations 第一节 相关分析 三、用编程计算相关系数 (一)散点图——gplot过程 一般格式: proc gplot data=数据集; plot 纵轴变量名*横轴变量名; symbol v=符号 cv= 颜色 h=点大小; run; 第一节 相关分析 Proc gplot data=salary ; plot salary*salbegin; symbol v=dot cv=green h=2; run; 第一节 相关分析 用编程计算相关系数常使用过程corr。 它的最简单用法为: proc corr data=数据集; var 变量名列; run; 第一节 相关分析 例如对数据集salary计算变量相关系数,可提 交以下程序: proc corr data=salary; var educ jobcat salbegin age prevexp salary salbegin ; run; 默认计算pearson相关系数. Spearman和 kendall相关直接在corr过程中加上关键词spearman 和kendall即可。 第一节 相关分析 若关心一些变量和另一些不同的变量间的相 关系数,则可用语句with规定另一组变量,程序 会提供有var和with设定的两组变量间的相关系数。 提交以下程序: proc corr data=salary; var educ jobcat salbegin age prevexp ; with salary salbegin ; run; 第一节 相关分析 偏相关系数计算——partial 语句 proc corr data=salary;

文档评论(0)

1亿VIP精品文档

相关文档