- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
编辑版word
编辑版word
编辑版word
分类数据常用统计方法
在科研数据的统计分析中,经常会遇到分类数据。分类数据包括计数资料和等级资料,两者都是将观察指标分类(组),然后统计每一类(组)数目所得到的数据,区别是如果观察指标的分类是无序的则为计数资料,也叫定性资料或无序分类变量;如果观察指标的分类是有序的,则为等级资料,也叫有序分类数据。如调查某人群的血型分布,按照A、B、AB与O四型分组,计数所得该人群的各血型组的人数就是计数资料(因为A、B、AB与O血型之间是平等的,并没有度或量的差异);观察用某药治疗某病患者的疗效,以患者为观察单位,结果可分为治愈、显效、好转、无效四级,然后对该病的患者,分别计数治愈、显效、无效、好转的人数则为等级数据(因为无效的疗效最差、次之为好转、治愈的疗效最好,它们之间有度或者量的区别)。分类数据进行统计分析时要列成表格,根据表格中分组变量和指标变量的性质、样本含量()和理论频数()的大小以及分析的目的,所用的统计方法是不一样的。下面通过一些有代表性的例子来介绍分类数据常用的统计分析方法。
一、2×2表
2×2表也叫四格表。在实验研究中,将研究对象分为2组进行实验,实验只有2种可能的结果,如阳性与阴性,故叫2×2表;因为基本数据只有4个,所以也叫四格表。根据不同的实验安排,四格表又分为完全随机设计四格表和配对设计四格表。
表1某抗生素的人群耐药性情况
用药史
不敏感
敏感
合计
耐药率(%)
曾服该药
180(174.10)
215(220.90)
395
45.57
未服该药
73(78.90)
106(100.10)
179
40.78
合计
253
321
574
44.08
表1为完全随机设计四格表。其目的是要比较曾服该抗生素的人群和未曾服过该抗生素的人群,对该抗生素的耐药率有无差异。表格中的四个基本数据(也叫实际频数)分别为180、215、73、106;括号中的四个数据(174.10、220.90、78.90、100.10)为四个理论频数(),因且四个理论频数()均大于5,故应用Pearson检验。经(SPSS11.0,以下同)计算=1.145,P=0.2850.05,故可认为曾服过该抗生素的人群和未曾服过该抗生素的人群对该抗生素的耐药率无差异。
表2两个年级大学生的近视眼患病率比较
年级
近视
非近视
合计
近视率(%)
四年级
2(4.67)
26(23.33)
28
7.14
五年级
5(2.33)
9(11.69)
14
35.71
合计
7
35
42
16.67
表2也为完全随机设计四格表。虽但有两个格子的理论频数比1大比5小,此时需对进行连续性校正(因为理论频数太小,会导致增大,易出现错误的有差异的结论)。经计算,连续性校正的=3.621,P=0.0570.05,可认为大学四年级与大学5年级学生近视眼的患病率无差异。如果不用连续性校正的检验,则=5.486,P=0.0190.05,则会得出五年级大学生近视眼的患病率高于四年级大学生的错误结论。
表3两种疗法对腰椎间盘脱出症的疗效
疗法
治愈
未治愈
合计
治愈率(%)
新疗法
7
2
9
77.78
保守疗法
2
6
8
25.00
合计
9
8
17
52.94
表3也为完全随机设计四格表。因=1740(或有理论频数小于1),即使采用校正公式计算也会有偏差,此时应采用四格表的Fisher确切检验法。经计算P=0.0570.05,故认为新疗法与保守疗法对腰椎间盘脱出症的治愈率无差异。
表4198份痰液标本分别用A、B两种培养基的培养结果
A培养基
B培养基
合计
+
-
+
48
24
72
-
20
106
126
合计
68
130
198
表4为配对设计四格表。A、B两种培养基对同一份标本的培养结果视为对子数据,故为配对设计。欲分析A、B两种培养基的培养结果有无差异,应用配对四格表(也叫McNemar)检验。经计算P=0.6520.05,故认为A、B两种培养基的培养结果无差异。
表5三个不同地区血型样本的频数分布
地区
A
B
AB
O
合计
亚洲
321
369
95
295
1080
欧洲
258
43
22
194
517
北美洲
408
106
37
444
995
合计
987
518
154
933
2592
表5为完全随机设计的R×C表。与四格表不同的是:表5的行或列均超过2,此类表格统称为行×列表,也叫R×C表。四格表也可以视为行(或R)=2,列(或C)=2的行×列表。此表因为结果变量(血型)为多分类,故属于多个构成比的比较。欲分析不同地区人群的血型分布构成有无差异,应用Pearson检验。经计算=297.375,P=0.0000.05,可
文档评论(0)