- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第07章定性资料的分析
PAGE
-PAGE 96-
第7章 定性资料的分析
在2.4节介绍了定性资料的统计描述,4.3节和4.4节介绍了率和事件数的可信区间估计,本章将进一步讲述定性资料的假设检验。其中,包括率的比较、构成比的比较及事件数的比较。
§ 7.1 样本率与总体率的比较
样本率与总体率比较的目的是推断该样本是否来自某已知总体。抽样误差理论告诉我们,从率为?0的总体中所得的随机样本,样本率p一般不会正好等于总体率。样本率与总体率的差异是本质上的差别还是抽样误差,可用假设检验进行推断。
从2.6节可知,率的分布服从二项分布。当n较大时,二项分布的累计概率与正态分布的累计概率相近,故可用正态近似方法。关于n的大小,一般习惯上以np≥5同时n(1-p) ≥5为界限,符合此条件者即可用正态近似检验。统计量u的计算为:
(7.1)
而当n和p不符合上???条件时,须用二项分布法计算可信区间(见4.3节)。
例7.1 据临床经验,一般的胃溃疡病患者有20%会出现胃出血症状。某医院观察了304例65岁以上的胃溃疡病患者,其中有96例发生胃出血,占31.58%,问老年患者是否较一般患者易出血?
检验假设: H0:?=?0, 老年胃溃疡病患者的胃出血率等于20%;
H1:??0, 老年胃溃疡病患者的胃出血率大于20%。
单侧?=0.05。
u0.01(单侧) = 2.33
得P0.01,按?=0.05水准,拒绝H0,接受H1,差别有统计学意义。故可认为老年胃溃疡病患者的胃出血率大于20%。
§ 7.2 两样本率的比较
7.2.1 两样本率的u检验
两个样本率比较的目的是推断相应的两总体率是否相等。检验方法可用u检验和7.2.2节的?2检验(chi-square test)。
例7.2 某医院肿瘤科3 年中共治疗乳腺癌患者n=131例,每例均观察满5年,其中单纯手术治疗组观察n1=84例,存活x1=57例,存活率p1=67.9%,联合治疗(手术+术后化疗)组观察n2=47例,存活x2=39例,存活p2=83.0%,问两组存活率有无差别?
资料显示两组患者5年存活率不同。由于样本率与相应总体率间存在抽样误差,那么两组存活率间的的差别究竟是不同治疗方法导致本质上的差别,还是仅仅系抽样误差所致?为此,需进行假设检验。
两样本率比较的检验假设为:
H0:两总体存活率相等,即?1=?2;
H1:两总体存活率不等,即?1??2。
? = 0.05。
用正态近似检验,检验统计量u为:
(7.2)
式中p1、p2分别为两样本率,为率差的标准误;n1、n2分别为两样本例数;pc为两样本合计率,pc=(x1+x2)/ (n1+n2)。
本例:<u0.05(双侧)=1.96
得P>0.05,按?=0.05水准,不拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。
由2.6节可知,当n较大时,二项分布可用正态分布近似计算。因此,这里所介绍的两样本率比较的u检验,当n1p1、n2p2、n1 (1?p1)、n2 (1-p2)均大于5时才适用,如果n较小,则可用校正的u检验:
(7.3)
而当n很小时(比如n≤40时),则须用确切概率法(见7.7节)。
7.2.2 两样本率的?2检验
u检验与t检验的思路相同,反映的是在标准误的尺度下,样本统计量与相应总体参数之偏离。这里介绍另一种检验方法,即?2检验(chi-square test),其思路虽与u检验、t检验不同,但确有异曲同工之妙。
首先将例7.2资料整理成表7.1形式的分类频数表。
表7.1 131例乳腺癌患者治疗后5年存活率的比较
处 理存活数死亡数合计治疗数存活率(%)联合治疗39(a)8(b)47(a+b)83.0单纯治疗57(c)27(d)84(c+d)67.9合 计96(a+c)35(b+d)131(n=a+b+c+d)73.3
① 四格表(fourfold table)的概念 表7.1内, ab 这四个格子的频数是整个表的cd基本数据,其余数据都是从这四个基本数据派生出来的,这类资料称为四格表或2×2列联表(2×2 contingency table)资料。
= 2 \* GB3 ② 检验假设 同例7.1。即:
H0:两总体存活率相等,即?1=?2;
H1:两总体存活率不等,即?1??2。
? = 0.05。
= 3 \* GB3 ③ H0条件
原创力文档


文档评论(0)