R语言--列联表检验和相关性检验.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言--列联表检验和相关性检验

R语言实用教程 第五章 假设检验 假设检验简介 5.5 列联表检验 5.6 相关性检验 总结 假设检验简介 概念 方法 基本思想 两类错误 P值 假设检验简介 概念:假设检验是统计推断中的一个重要内容,它是利用样 本数据对某个事先做出的统计假设按照某种设计好的 方法进行检验,判断此假设是否正确。 方法 参数性假设检验:总体分布已知,通过样本检验 关于未知参数的某个检验。 非参数性假设检验:总体分布未知时的检验问题。 1. 2. 原假设/零假设(记为H0):作为检验的对象的假设。 备择假设(记为H1):与原假设对立的假设。 用t.test()函数作 t 检验 用var.test()函数作 F 检验 用prop.text()函数作二项分布的近似检验 假设检验简介 基本思想:反证法思想 为了检验一个“假设”是否成立,就先假定这个“假设”是成立的,而看由此会产生的效果。如果导致一个不合理现象出现,就表明原先的“假设”不成立,就拒绝这个“假设”;如果由此没有导致不合理现象的发生,则不能拒绝原“假设”。 该方法又区别于纯数学中的反证法。这里所谓的“不合理”,并不是形式逻辑中的绝对矛盾,而是基于人们实践中广泛采用的一个原则:小概率事件在一次观察中可以认为基本上不会发生。 3. 假设检验简介 两类错误: 第一类错误:否定了真实的原假设。 犯第一类错误的概率为:P {否定H0|H0为真|} 第二类错误:接受了错误的原假设。 犯第二类错误的概率为:P {接受H0|H0为假|} 4. P值: 5. 犯第一类错误的概率,即:P 值=P {否定H0|H0为真} 当P值α(如α=0.05),则拒绝原假设;否则,接受原假设。 使用P值的方法与使用拒绝域的方法是等价的。 5.5 列联表检验 概念 Pearsonχ2独立性检验 Fisher精确独立性检验 McNemar检验 三维列联表的条件独立性检验 5.5 列联表检验 设两个随机变量X,Y均为离散型的,X取值于{a1, a2, …,aI}, Y取值于{b1, b2, …,bJ}。设(X1,Y1),(X2,Y2), …,(Xn,Yn)为简单样本,记nij为(X1,Y1),(X2,Y2), …,(Xn,Yn)中等于( ai, aj )的个数。在求解问题时,常把数据列为形如表5.9的形式,称为列联表;根据列联表数据做的检验称为列联表检验。 概念: 1. b1 b2 … bJ 合计 a1 n11 n12 … n1J n1· a2 n21 n22 … n2J n2· . . . . . . . . . . . . . . . aI nI1 n2J … nIJ nI· 合计 N·1 N·1 … N·1 表5.9 列联表 5.5 列联表检验 Pearsonχ2独立性检验: 2. H0:X与Y独立,H1:X与Y不独立(相关). 用chisq.test()函数可完成列联表数据的Pearsonχ2独立性检验,需将列联表写成矩阵形式。 P198,使用该函数计算 Pearson拟合优度χ2检验 5.5 列联表检验 例5.26 在一次社会调查中,以问卷方式共调查了901人的月收入及对工作的满意程度,其中有收入A分为:小于3000元、3000~7500元、7500~12000元及超过12000元4档。对工作的满意程度B分为:很不满意、较不满意、基本满意和很满意4档。调查表用4x4列联表表示,如表5.10所示。试分析工资收入与对工作的满意度是否有关。 工资收入 很不满意 较不满意 基本满意 很满意 合计 3000 20 24 80 82 206 3000~7500 22 38 104 125 289 7500~12000 13 28 81 113 235 12000 7 18 54 92 171 合计 62 108 319 412 901 表5.10 列联表 5.5 列联表检验 例5.27 为了研究吸烟是否与患肺癌有关,对63位肺癌患者及43名非肺癌患者(对照组)调查了其中的吸烟人数,得到2x2列联表,如表5.11所示。 患肺癌 未患肺癌 合计 吸烟 60 32 92 不吸烟 3 11 14 合计 63 43 106 表5.11 列联表 Chisq.test(x,correct=FALSE) 与 Chisq.test(x) 采用连续修正的情况下, 参数orrect默认为TRUE 5.5 列联表检验 Fisher精确独立性检验: 3. 在样本数较小时,需要用Fishe

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档