卡方检验与相关回归.docVIP

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卡方检验 本讲涉及的卡方检验(同上一讲的拟合优度检验有所不同)要用于推断两个或多个总体率、构成比是否有差别;两个分类变量间是否存在关联等;两个等级变量间是否存在线性趋势。通常我们作卡方检验只用到了Crosstabs命令中极少部分的功能。 Crosstabs: 例如某医生用两种药物治疗十二指肠溃疡,问两种药物疗效是否不同,数据间胃溃疡.sav: Rows框用于选择行变量;Columns框用于选择列变量;Layer指的是分层分析,将分层变量选入Layer框中,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next设为不同层。 Display clustered bar charts复选框显示复式条图。 Suppress table复选框禁止在结果中输出行×列表(主要用于表格过于巨大时为了节省空间)。 Exact选项含义同前Statistics对话框,用于定义所需计算的统计量。 接着要在statistics中定义如何分析,以及如果相了解两变量间关联应该如何选关联指标: Chi-square复选框:计算Pearson ?2值。Correlations复选框:计算行、列两变量的Pearson相关系数Pearson关联系数r又称为?)和Spearman等级相关系数Spearman等级相关系数又称为秩相关系数rs或又称为?s)。 *比如两正态变量间的Pearson相关系数可以用crosstab过程计算,只要将correlations勾上即可 在列联表的分析中,除了计算卡方值外,有时还要了解行列变量间的关联密切程度;SPSS为我们提供了针对行列变量均为无序分类(Nominal)、等级变量(Ordinal)的列联表关联程度的衡量指标: Nominal表示是否分类性,Contingency coefficient复选框:即列联系数,其值界于0~1之间;Phi and Cramers V复选框:??(Phi)=,四格表?2检验中界于~1之间,Cramers V 表示,v=,它同样界于0~1之间Lambda复选框:Goodman Kruskals lambda(?),表示用某个变量预测另外一个变量时能够减少估计错误概率的大小。其值为1时表明自变量预测应变量为0时表明自变量预测应变量差Goodman Kruskals tau(?),该系数同样是不对称的,它的含义同?,都表示用某个变量预测另外一个变量时能够减少估计错误概率的大小,只不过计算的过程不太相同而已。Uncertainty coefficient复选框:Lambda同属于误差概率减少指标(Proportion Reduction of Error),又称UC 或 Theils U(不确定系数,其值接近1时表明后一变量的信息很大程度来自前一变量,其值接近0时表明后一变量的信息与前一变量无关。Ordinal选择是否输出反映有序分类相关性的指标Gamma复选框:Goodman Kruskals Gamma(?),其原理是分别计算列联表中分类一致(concordant,P)以及不一致(discordant,Q)的对比数,计算(P-Q)/(P+Q)即为伽马值。如果一致的对比数大于不一致的,则伽马值为正值,表示在某一个变量的取值随着另一个变量有增大的倾向,两者存在正相关;如果一致的对比数小于不一致的,则伽马值为负值,表示在某一个变量的取值随着另一个变量有减小的倾向,两者存在负相关;而如果如果一致的对比数等于不一致的,则伽马值为0,表示在某一个变量的取值与另一个变量的取值没有关联。伽马值是对称的。但是伽马值没有考虑等秩(tie)的对比数,所以下面有三个指标用于解决这个问题。 2)Somersd复选框:?以及下面介绍的????c的计算过程中不区分自变量与因变量,因而它们是对称的;该系数的计算过程中假设行或列上的一个变量为自变量,Somers d = (P-Q)/(P+Q+T),P、Q的含义同上,T为以因变量中等秩的对子数;其含义的解释同伽马值。 3)Kendalls tau-b复选框:??b=,P、Q的含义同上,TR为以行变量中等秩的对子数,TC为以列变量中等秩的对子数;??b界于-1~1之间;Kendalls tau-c复选框:??c=2m(P-Q) / [N2(m-1)],P、Q的含义同上,N为总例数,m为行数或列数中较小的一个。??c界于-1~1之间?)值供选择;所谓的Nominal by Interval是指一个变量为等间距的等级变量(该变量通常是数值型变量,通过一定标准划分为等距的等级;比如每个人的吸烟量原先是离散型数值变量,通过一定的标准划分为0~、5~、10~、15~、20~

文档评论(0)

ktj823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档