第五讲 列联表分析.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲 列联表分析

第五讲 列联表分析 导言 在数据分析中,我们不仅需要了解单一变量的数值分布特征,还需要了解一个变量与另一个变量之间的关系。 例如,我们不仅想了解一个班级中同学们的性别结构,同时还想知道不同性别的同学在某一问题上的态度是否不同。当不同性别的同学在该问题上的态度有明显差异时,我们可以说,性别与态度这两个变量之间存在相关关系。 所谓相关,是指一个变量的值与两一个变量的值有连带性,即一个变量的取值发生变化,另一个变量的取值也跟着发生变化。 相关关系不一定是因果关系,但是因果关系必定存在相关关系。 啤酒与尿布 在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的稍量大幅增加了。 这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。 导言 为了了解一个变量与另一个变量之间是否存在相关关系以及相关的强度大小,在统计上常用的方法是做列联表或者是计算两个变量之间的相关系数。 读者通过列联表可以直观地感受到两个变量之间是否存在相关关系及其关系的强弱和方向,而相关系数则更精确地反映了两个变量之间的相关关系强度的大小和方向。 导言 一、列联表(contingency table) 一、列联表(contingency table) 1.由两个以上的变量交叉分类的频数分布表 2.行变量的类别用 r 表示, ri 表示第 i 个类别 3.列变量的类别用 c 表示, cj 表示第 j 个类别 4.每种组合的观察频数用 fij 表示 5.表中列出了行变量和列变量的所有可能的组合 6.一个 r 行 c 列的列联表称为 r ×c 列联表 一、列联表(contingency table) 一、列联表(contingency table) 一、列联表(contingency table) 编制条件百分比表时应该注意: 1.顶端有表号和标题。 2.舍去不必要线条,尽可能简洁,上下粗线条,左右不封口。 3.自变量取值下标明%,条件百分比不必再一一标%。 4.表地段()的数值,表示在计算百分比时所依据的个案数目。 5.表内各百分比数值的小数位数应该保持一致。 6.根据自变量的方向计算百分比,但当因变量在样本中的分布不能代表其在总体中的分布时则要根据因变量的方向计算百分比。 一、列联表(contingency table) 一般而言,将因变量放在表的左边,自变量放在表的上边,r×c表,r表示的因变量的取值个数,c表示的是自变量的取值个数。按照根据自变量方向计算百分比,即根据列来计算百分比。 一、列联表(contingency table) 一、列联表(contingency table) 根据因变量方向计算百分比举例 研究某城市破裂家庭(自变量)对青少年犯罪行为(因变量)的影响。如何抽样?假定该城市的全部青少年中,未犯罪的青少年有54400名,有越轨行为的青少年960名。 现在我们决定从未犯罪青少年中抽取1%,即544名,但如果按照相同的比例从犯罪的青少年中抽取样本的话,则只能抽取10个人,这样的样本太小,难以进行准确的比较。因此,按照50%的比例从犯罪青少年中抽取480名作为样本。 一、列联表(contingency table) 一、列联表(contingency table) 列联表的SPSS实现。(略) 条件百分比表的优点: 资料丰富,一个3×3列联表就有9个百分比可供比较。 条件百分比表的缺点: 当r×c很大时,百分比会很多,不容易看出两个变量之间的关系。比如一个5×6表就会30个百分比,就很难看出两个变量之间是否存在相关关系。 此时,我们就希望有一个数值来表示两个变量之间的相关关系的强度和方向,以使资料更加简化和明白易懂,这就是相关系数。 二、相关系数( correlation coefficient ) 相关系数即用来表示两个变量间相关强度和方向的统计值。 相关系数非常多,当我们选择相关系数时, 首先,根据变量的测量层次,不同层次的变量需要选择不同的相关系数。 其次,两个变量之间关系是对称的还是不对称的,对称关系即不区分自变量和因变量,而不对称关系则要区分自变量和因变

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档