第三章单变量描述统计分析-课程中心30.ppt

第三章单变量描述统计分析-课程中心30.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * 卡方检验注意事项 一,列联表的单元格不应太少,例如2×2的列联表需要进行连续型修正和采用Fisher精确检验进行校对。 二,各单元格中的期望频数,不应有期望频数小于1的单元格,或大量的期望频数小于5的单元格。若列联表中有20%以上的单元格的期望频数小于5,则一般不宜用卡方检验。此时,可以合并采用合并相邻单元格或采用似然率比卡方检验。 * * 三,总频数n应较大,一般至少大于50,大于100更好。在小样本是可主要参考连续性校正和Fisher的精确检验。 四、卡方值的大小会受到样本量的影响,若各个单元格中的样本数均等比例扩大10倍,于是卡方值也会随之扩大10倍。但由于自由度和显著水平没有改变,卡方的临界值不变,进而使拒绝零假设的可能性增高。即在样本量很大时,容易得到“两变量有关联”的结论,即便两变量的关联性很微弱时。 五、当行列变量都是定序型变量,可以参考线性相关卡方检验,该检验是检验两个定序的行列变量间是否具有线性相关性。 * 度量变量间相关程度的统计量 除上述卡方检验法之外,SPSS还提供了其他度量变量间相关关系的检验方法,帮助人们了解变量间相互依赖的强弱程度,量化交叉分类变量间的关系。 四大类相关分析的检验方法。判断方法:系数的绝对值越接近于1,则变量的相关性越强;越接近于0,则变量间相互独立。正负号代表相关方向。 变量的类型大致分为:定类、定序、定距。当定序变量的类别数较多时,可以近似将定序视为定距,常规上变量类型在使用上只允许降级使用,不许用升级使用。 * * 卡方检验 1两定类 2一定类一定距 3两定序 医学分析中 常用指标 4两定距或两定序 Statistics 适用于两定类变量的方法: 检验的统计量有列联系数、Phi系数、Cramer ’V系数、Lambda、不确定系数等。这些方法大都是从Pearson卡方统计量派生出来的,试图将样本量、行列数对卡方的影响减少到最小。 Phi适用于2×2的列联表。 列联系数适用任意行列数的列联表,但注意到列联系数的最大值会随行列数的增大而增大。因此,在比较两两变量间的相关性时,注意应在行列数均相同的前提下才有可比性。 * Cramer ’V 适用于任意行列数的列联表,在2×2的列联表中,V系数和Phi系数是相等的。 * 适用于两定序变量的方法: 检验的统计量有Gamma系数、Somers’d系数Kendall’s Tau-b系数、 Kendall’s Tau-c系数等。 这些方法均是围绕“同序对数”和“异序对数” 展开的,它们是变量相关性检验的非参数方法中 的两个重要指标。 Kendall’s Tau-b系数适用于n×n的列联表。 Kendall’s Tau-c系数适用于任意列联表。 * Gamma系数适用于2×2的列联表。 * 适用于两定距或两定序变量的方法: 检验的统计量有Pearson相关系数(参数方法)和Spearson相关系数(非参数方法)。他们的取值在-1~1之间,绝对值越大,相关性越强,且是表明线性相关性越强。 由于列联表分析中,定距型变量通常不作为行列变量,因此在交叉列联表的分析中该选项基本不用。在相关性分析的模块中提供了相应的使用。 * 适用于一定类变量、一定距变量的方法: 其相关性检验方法是Eta系数。该方法的核心思想类似于单因素方差分析。它将定类变量作为“控制变量”(Independent,解释变量),将定距变量当作观测变量(Dependent,被解释变量)。然后分析观测变量的变差中有多少比例是可以由控制变量解释的。Eta系数的取值在0~1之间,越接近1,表示两变量的相关性越强。 * * 4.5 比率分析 Ratio 比率分析用于对两变量间变量值比率变化的描述分析,适用于定距变量。当研究者特别关心该比率在不同组间的变动情况是,该过程非常有用。 描述分析基本包括两大类:一类是集中趋势的描述指标,另一类是离散程度描述指标。 * 相对比分母的变量 分组变量 要求在结果窗口中输出分析结果 要求将分析结果存为外部数据 将数据按照分组变量值排序 相对比分子的变量 * 中位数 均数 加权均数 区间估计 平均绝对离差 离散系数 相关价格微分 基于中位数的变异系数 基于均数的变异系数 用于描述相比值落入某一区间所占的比例 自定义具体区间的上、下界 自定义距离中位数的百分比 * 集中系数 加权均数的算法为组内分子的均数除以分母的均数 * 4.4 多选项分析 多选项分析主要是针对问卷调查的多选项问题的。本节主要讨论多选项问题结果的保存(多选项问题的分解),以及多选项问题的频数分析。 多选项问题分解的两种办法:第一,多选项二分法;第

您可能关注的文档

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档