相关与回归分析过程.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
相关与回归分析过程

;相关分析简介;积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。 特点: 相关系数r 是一个无单位的量值,且-1 r 1; r 0 为正相关,r 0 为负相关; ?r ? 越接近于1,说明相关性越好;越接近于0,相关性越差。 Spearman等级相关系数:当数据不满足条件双变量正态时。;Gamma统计量:描述有序分类变量数据联系强度的指标,以下指标都是基于Gamma统计量衍生出来的。 Kendall‘s Tau-b:反映两个有序分类变量的一致性。 Kendall‘s Tau-c: 对Kendall‘s Tau-b进行了校正。;列联系数:基于?2值得出 Phi and Cramer‘s V:也是基于?2值得出 Lambda 系数:用于反映自变量对因变量的预测效果 不确定系数;Eta Kappa 值 OR、RR等; 除了Freq过程的measures选择项外,SAS还提供了其他更专业的相关分析过程:;相关分析CORR过程:; 例1 某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。;首先绘制散点图,结果如下:;Data corr_1; Input x y@@; Cards; 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; Proc corr spearman; Var x y; Run; ; 大家可以发现,对相同的数据,秩相关系数的绝对值比积差相关系数小,为什么?; 前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、Spearman 相关系数时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。下面以一个例子对此作进一步的说明。;表1 32例40岁以上男性的BMI指数、年龄、吸烟与收缩压实测值;续表一;续表二;Data corr_2; Input y x1-x3@@; Cards; 135 45 0 2.876 122 41 0 3.251 130 49 0 3.100 158 52 0 3.768 146 54 1 2.979 129 47 1 2.790 162 60 1 3.668 157 54 1 3.612 144 44 1 2.368 180 64 1 4.637 166 59 1 3.877 …… ;; 例4 仍以前数据为例,进一步作回归分析,计算进食量与体重增量之间的回归方程。;绘制散点图如下:;回归分析过程;简单回归分析;多元回归分析; 回归参数的最小二乘估计实为系数矩阵之逆矩阵与常数项矩阵(列向量)之乘积。其计算较为复杂,可以用统计软件求得。 用最小二乘法解出偏回归系数βj的估计值bj后,得到相应的多元线性回归方程为: 下面举例说明用SAS reg过程建立多元线性回归方程。;实例分析;;Proc reg data=corr_2; Model y=x1-x3 /selection=stepwise stb Sle=0.1 sls=0.1; Run; Quit; ;协方差分析 ;一元完全随机设计资料的协方差分析 ;不考虑年龄对肺活量的关系,直接用t检验比较二组工人的平均肺活量; 协方差分析需调用SAS的GLM过程来分析。 程序如下: proc glm data=coanova; class group; model y=x group/solution; lsmeans group/stderr pdiff; run; ;控制了年龄协变量 后二组修正均数间 无差异。;协方差分析对数据的要求:;用多元线性回归的方法来解决 1、设置哑变量 group= 2、分析哑变量与年龄的 交互作用,如交互作用 不存在,则回归线平行。 3、检验哑变量的回归系数是 否为零。;交互作用不显著,提示回归线平行

文档评论(0)

djdjix + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档