- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章 相关与线性回归分析-正式课件综述
第7章 相关与线性回归分析 ;在科学研究和生产实践中,经常要进行两类变量间关系的分析,例如仔畜的初生重与断奶重、饲料的营养浓度与畜禽增重速度的关系。
;第2节 相关分析 ;第2节 相关分析;二、用于相关分析的SAS过程—CORR过程
1、 CORR过程的调用格式
PROC CORR 选项;
VAR 变量名表;
WITH 变量名表;
PARTIAL 变量名表;
当进行普通相关分析时,只有PROC CORR语句是必须的,当进行偏相关分析时,PARTIAL语句也是必须的。其他语句都是可选择性的。;2、语句说明
PROC CORR语句
该语句用于调用CORR过程进行相关分析,其常用的选项主要包括:
①PEARSON
计算通常的Pearson相关系数,即直线相关系数,缺省时系统会默认计算出该相关系数。
②Spearman
计算Spearman等级相关系数(或秩相关系数)。
③NOSIMPLE
取消打印每个变量的描述性统计量(如平均数、标准差等)。如果该项缺省,则会打印出每个分析变量的基本统计量。
;(2)VAR语句
用于指明所要分析的变量,如果缺省,则系统默认对其他语句中没有提及的所有数值型变量进行分析。
(3)WITH语句
用于设定放在左边的变量,与VAR语句配合使用,此时VAR语句的变量间和WITH语句的变量间相关系数不给出,只输出VAR变量和WITH变量间的相关系数。如果该语句缺省,系统会计算VAR语句中的所有变量之间的两两相关系数。
3、结果输出
CORR过程在执行后,其输出的结果包括简单统计量、相关系数及显著性检验。 ; 4、实例应用分析
【例7.1】某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表7-1,试分析尿肌酐含量与年龄之间的相关关系。;程序7-1
DATA EX7_1;
INPUT X Y @@;
CARDS;
13 3.54 11 3.01 9 3.09 6 2.48 8 2.56 10 3.36 12 3.18 7 2.65
;
PROC CORR;
VAR X Y;
RUN;第3节 回归分析;三、回归分析涉及以下几方面内容:
1、估计。估计与方程有关的未知参数,并检验对于这些参数所做的统计假设,建立相应的回归模型
2、预报。用所得的回归方程对自变量的一组值估计因变量的值(点/区间估计)
3、自变量选择。从可能对因变量Y有影响的一组自变量中,挑选出对Y有影响的变量,剔除影响不大的变量,或按某一标准,建立最优的回归方程
4、模型诊断。检查数据、回归方程、统计推断方法中可能存在的问题,建立较合理的、稳健的模型.;四、建立回归方程的应用:
1、描述。描述某种现象与其影响因素的数量依存关系。例如,某疾病发病率与气温、湿度的关系。
2、预测。把预报因子(自变量)代入回归方程对预报量(因变量)及其波动范围进行估计。
3、控制。回归方程逆运算,即要求因变量在一定范围内波动,可以通过调控自变量的取值来实现。
五、线性回归分析的SAS过程
可采用REG和GLM两个过程来完成。REG过程进行一元或多元回归以及可线性化的非线性回归分析,通过适当的选项还可计算出变量间的简单相关系数,即采用REG过程可同时完成线性相关和回归分析。
;1、REG过程的调用格式
PROC REG 选项;
MODEL 因变量= 自变量/选项;
BY 变量;
WEIGHT 变量;
PRINT 选项;
PLOT y 轴变量*x轴变量[=‘符号’];
上述语句中,PROC REG和MODEL语句是必须的,其他语句是可选择性的。;2、语句说明
PROC REG语句
PROC REG 选项;
指明调用REG过程作回归分析。其常用的选项主要有:
① 数据集选项 DATA=SAS数据集:
指定分析数据集,如果缺省,则对最新创建的数据集进行分析;OUTEST=SAS数据集,要求将参数估计和选择的统计量输出到SAS数据集中等。
② 结果输出选项(CORR/SIMPLE)
CORR:对在MODEL和VAR语句中列出的所有变量计算简单r,并输出相关系数矩阵;
SIMPLE:对用REG过程进行分析的每个变量输出所有观测的总和、均值、标准差和平方和等简单统计量。;MODEL语句
(1)功用:定义所用的回归分析数学模型。
在MODEL语句中出现的变量必须是用于分析的数据集中的数值型变量。如想考虑模型中X1的二次项,不能在MODEL语句中使用XI*X1,而必须用DATA步骤产生一个新变量(如XISQUARE=X1*XI),然后再在MODEL语句中使用这个新变量。
(2)MODEL语句常用的选项主要有:
①
文档评论(0)