- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关与回归分析过程
;相关分析简介;积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。
特点:
相关系数r 是一个无单位的量值,且-1 r 1;
r 0 为正相关,r 0 为负相关;
?r ? 越接近于1,说明相关性越好;越接近于0,相关性越差。
Spearman等级相关系数:当数据不满足条件双变量正态时。;Gamma统计量:描述有序分类变量数据联系强度的指标,以下指标都是基于Gamma统计量衍生出来的。
Kendall‘s Tau-b:反映两个有序分类变量的一致性。
Kendall‘s Tau-c: 对Kendall‘s Tau-b进行了校正。;列联系数:基于?2值得出
Phi and Cramer‘s V:也是基于?2值得出
Lambda 系数:用于反映自变量对因变量的预测效果
不确定系数;Eta
Kappa 值
OR、RR等; 除了Freq过程的measures选择项外,SAS还提供了其他更专业的相关分析过程:;相关分析CORR过程:; 例1 某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。;首先绘制散点图,结果如下:;Data corr_1;
Input x y@@;
Cards;
165 780 158
720 130 867 180
690 134 787 167
934 186 679 145
639 120 820 158
;
Proc corr spearman;
Var x y;
Run;
; 大家可以发现,对相同的数据,秩相关系数的绝对值比积差相关系数小,为什么?; 前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、Spearman 相关系数时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。下面以一个例子对此作进一步的说明。;表1 32例40岁以上男性的BMI指数、年龄、吸烟与收缩压实测值;续表一;续表二;Data corr_2;
Input y x1-x3@@;
Cards;
135 45 0 2.876
122 41 0 3.251
130 49 0 3.100
158 52 0 3.768
146 54 1 2.979
129 47 1 2.790
162 60 1 3.668
157 54 1 3.612
144 44 1 2.368
180 64 1 4.637
166 59 1 3.877
……
;; 例4 仍以前数据为例,进一步作回归分析,计算进食量与体重增量之间的回归方程。;绘制散点图如下:;回归分析过程;简单回归分析;多元回归分析; 回归参数的最小二乘估计实为系数矩阵之逆矩阵与常数项矩阵(列向量)之乘积。其计算较为复杂,可以用统计软件求得。
用最小二乘法解出偏回归系数βj的估计值bj后,得到相应的多元线性回归方程为:
下面举例说明用SAS reg过程建立多元线性回归方程。;实例分析;;Proc reg data=corr_2;
Model y=x1-x3
/selection=stepwise stb
Sle=0.1 sls=0.1;
Run;
Quit;
;协方差分析;一元完全随机设计资料的协方差分析 ;不考虑年龄对肺活量的关系,直接用t检验比较二组工人的平均肺活量; 协方差分析需调用SAS的GLM过程来分析。
程序如下:
proc glm data=coanova;
class group;
model y=x group/solution;
lsmeans group/stderr pdiff;
run;
;控制了年龄协变量
后二组修正均数间
无差异。;协方差分析对数据的要求:;用多元线性回归的方法来解决
1、设置哑变量
group=
2、分析哑变量与年龄的
交互作用,如交互作用
不存在,则回归线平行。
3、检验哑变量的回归系数是
否为零。;交互作用不显著,提示回归线平行
文档评论(0)