网站大量收购独家精品文档,联系QQ:2885784924

专题7__交叉分类和卡方检验.doc

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题7__交叉分类和卡方检验

专题7 交叉分类(列联表)和卡方检验 (本专题较深入的理论和分析可参考Bishop等的《离散多元分析》) (各部分较浅显、直观的说明可参考的资料在各部分列出) 变量的测度 交叉分类问题 Crosstabs过程 变量的测度 英文名称 测度 量表 社科研究变量类型 性质 有序 有距 有绝对零 Nominal Measure 名义测度 名称量表 定类变量 Ordinal Measure 序次测度 顺序量表 定序变量 Interval Measure 间距测度 区间量表 定距变量 Scale Measure 比例测度 比例量表 定比变量 注: 这里是按测度由低级到高级排列的,高级测度的变量可以看作或转化为低级测度的变量。 SPSS中变量定义时,没有Interval Measure,只有Scale Measure。 社科研究中常常将不专门列出定比变量这一类,而将其包含在定距变量中。 返回 交叉分类问题 比较和对照是进行科学研究的基本手段。对于间距测度和比例测度的资料,进行分组比较时可以用均数检验、方差分析等方法。对于有较多可取值的序次测度资料,进行分组比较时可以用各种秩和检验方法。 而对于名义测度的资料、有序分类所得的资料(也属序次测度),分组比较时需用交叉分类进行统计描述,交叉分类所得的表格称为“列联表”,统计推断(检验)则要使用列联表分析的方法------卡方检验。卡方分析是用来研究两个定类变量间是否独立即是否存在某种关联性的最常用的方法。 例:按“性别”和“肥胖程度”交叉分类所得列联表如下: 性别 肥胖程度 不肥胖 轻度肥胖 中/重度肥胖 Total 男 19 9 15 43 女 49 14 43 106 Total 68 23 58 149 这里是按两个变量交叉分类的,该列联表称为两维列联表,若按3个变量交叉分类,所得的列联表称为3维列联表,依次类推。3维及以上的列联表通常称为“多维列联表”或“高维列联表”,而一维列联表就是频数分布表。 卡方分析的方法:假设两个变量是相互独立,互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表;如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。这种差值用一个卡方统计量来表示;对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。   应用交叉列联表卡方检验时,应注意以下几个问题: 列联表各单元格中频数大小的问题 列联表中不应有期望频数小于1的单元格,或不应有大量的期望频数小于5的单元格。如果交叉列联表中有20%以上的单元格中的期望频数小于5,则一般不宜用卡方检验。 样本量大小的问题 卡方值的大小会受到样本量大小的影响,因此卡方检验受样本量的影响很大。同样两个变量,不同的样本量,可能得出不同的结论。例如:在某列联表中,若各个单元格的样本数均同比例扩大10倍,卡方值也会随之扩大10倍。由于自由度和显著度水平未改变,卡方的临界值不变,从而使拒绝原假设的可能性增加。因此,有必要对Pearson卡方值进行修正,以消除样本量的影响。可采用列联系数、Phi系数等进行修正。 对变量取值的不同分类的问题 对变量取值的不同分类会引起卡方值的改变,有可能得到不同的结论。所以在分类时不能随意,要有理论或统计上的依据。特别是对定距或定序变量,要先将变量的取值分组归类,才能使用卡方分析,而且由于分组的方法不同,也会得出不同的结论;同时,对于定距或定序变量用卡方分析,没有充分利用它们的数量信息。 返回 Crosstabs过程 Crosstabs过程的使用方法 Crosstabs过程的主界面 “Cells”按钮 “Format”按钮 “Statistics”按钮 “Exact”按钮 返回 Crosstabs过程的主界面 通过菜单项“Analyze→Descriptive Statistics→Crosstabs”可进入如下的Crosstabs过程主界面: 其中“Row[s]”矩形框用于放置列联表的行变量,即该变量不同的值对应列联表中不同的行。“Column[s]”矩形框用于放置列联表的列变量。行变量和列变量都是必须设置的。 “Layer” 矩形框用于放置层变量。层变量不是必需的,若设置了层变量,则行变量和列变量将针对层变量的每个取值(有多层时为取值组

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档