6卡方检验解析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十六章 卡方检验 参数与非参数检验 卡方匹配度检验 卡方独立性检验 一、参数与非参数检验 参数检验 : 用于等比/等距型数据 对参数的前提:正态分布和方差同质 非参数检验 不用对参数进行假设 对分布较少有要求,也叫distribution-free tests 用于类目/顺序型数据 没有参数检验敏感,效力低 因此在二者都可用时,总是用参数检验 数据的类型与卡方检验 ??检验又叫列联表分析或交叉表分析、表中的单元格内可以是计数的次数也可以是百分比,所以又可以称为百分比检验。 ??检验分析计数数据的时候,对计数数据的分布形态不作任何假设,因此视为非参数检验的一种。 二、卡方匹配度(拟合优度)检验 用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度 ,是对次数分布的检验 研究情境 在医生职业中,男的多还是女的多? 在三种咖啡中,中国人喜欢哪种? 在广中医中,各国留学生的比例有代表性吗? 前提: 观察彼此之间独立 每个单元格的期望次数不小于5 例题 在某校学生当中调查对一个新的教学方法的态度,赞成、反对和无所谓的比例是2:1:1。随机抽取了其中一个班级共60人,赞成的学生有37人,反对的学生有14人,觉得无所谓的人有9人。那么这个班级三种态度的比例是否符合全校的比例? Ho:班级学生的三种态度比例为2:1:1,即可得到相应的期望次数依次为30,15,15. H1: 计算公式 fe:期望次数 fo:观察次数 df=C-1,C是类目的个数 单元格卡方值大于2.5,则该因素的贡献较大; 最终所有单元格的总和卡方值越大,说明观察次数与期望次数的差异越大。 同步练习 例16-2 正态分布匹配度检验 同步练习 例16-3 三、卡方独立性检验 解决两个类目型或顺序型变量是否相关的问题 检验行和列的两个变量彼此有无关联 类似于独立样本比较问题 前提和限制:观察彼此独立,单位格期望值不小于5 一个简化的 2?2 列联表 例16-4 有人认为城市的生活环境更容易让人抑郁,于是他随机调查了定居城市的120人和定居农村的80人,对他们施测抑郁自评量表。结果发现,城市调查者中有38人有轻度以上抑郁,而农村只有12人有抑郁。这个数据是否支持他的论点呢? Ho:抑郁倾向和定居地之间是独立的(无关的)。 H1:抑郁倾向和定居地之间有关系。 计算期望次数 fe=(fc*fr)/n 计算每个单位格的卡方值 卡方检验的效应水平 分类变量的相关系数Ф 测度 2?2列联表中数据相关程度的一个量 对于2?2 列联表,Ф 系数的值在0~1之间 Ф 相关系数的计算公式 Ф 相关系数 (原理分析) 一个简化的 2?2 列联表 Ф 相关系数 (原理分析) (不考) 列联表中每个单元格的期望频数分别为 Ф 相关系数 (原理分析) 将??入Ф 相关系数的计算公式得 匹配度检验和独立性检验的区别 (一)独立性检验的次数资料是按两因子属性类别进行归组。根据两因子属性类别数的不同而构成2×2、2×c、r×c列联表(r为行因子的属性类别数,c为列因子的属性类别数)。而配合度检验只按某一因子的属性类别将如性别、表现型等次数资料归组 (二)配合度检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。 同步练习 P275 第6 P283 第4、5题 卡方检验的应用 (1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从Poisson分布等。 (2)检验某个分类变量各类的出现概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为1/36;掷硬币时,正反两面出现的概率是否均为0.5。 (3)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。 (4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。 (5)检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。 课后练习 习题册 第十章 卡方(X2)分布与卡方检验 * 数 据 定量数据 (数值型数据) 定性数据 (品质数据或称次数计数数据) 离散数据 连续数据 数 据 定量数据 (数值型数据) 定性数据 (品质数据或称次数计数数据) 离散数据 连续数据 数 据 定量数据 (数值

文档评论(0)

我是兰花草 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档