第5章定性资料的统计描述.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 定性资料的统计描述 在医学研究与实践中,大量资料都是按照事物的特征或属性进行分类的,这类资料称为定性资料,也称 分类资料或计数资料。如性别、HIV感染情况、病情轻重等都属于分类资料。分类资料按类别分类计数 所得到的数叫绝对数,绝对数往往不便于进行相互比较。例如甲医院某年因某病死亡105人,同年乙医 院因该病死亡185人。但不能据此认为乙医院该病的死亡情况比甲医院严重,因为两医院因该病住院的 人数不一定相等,此时需要采用相对数指标进行统计描述。 第一节 常用相对数及其应用 一、定性资料的频数分布 与定量资料一样,定性资料也可通过编制频数分布表描述其分布特征,并通过计算一些常用的相对数指 标进行统计描述和统计推断。定性资料频数分布表又称为列联表,是用两个分类变量对同一资料进行双 向分类形成的表,可用于考察两种属性的关系。表5.1为某中学不同性别青春期少年对自身体型感觉的构 成情况的列联表。 表5.1 某中学不同性别青春期少年对自身体型感觉的构成情况 性别 自感偏瘦 正常 自感偏胖 男 39 186 20 女 25 130 54 列联表的横标目一般为分组变量,纵标目为结局变量。列联表的用途主要有: 1. 列出每组中各种不同结局分类后的频数。 2. 描述频数分布的特征。 3. 便于进一步对分类资料的特征进行统计描述和统计推断。 二、 常用相对数指标 除了用频数分布表可以全面反映定性资料的特征外,也可计算相对数指标来描述定性资料的特征。相对 数是两个有关联的数值之比,常用的相对数指标有率、构成比和相对比三种。 (一)率 率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象 发生的频率或强度。根据计算公式中分母的观察单位总数是否引入时间因素,率包括频率和速率两类指 标。 频率(frequency)计算中,分母没有引入时间因素,无时间量纲,分子是分母的一部分,其取值在0~1之 间,如常见的发病率、患病率、病死率、治愈率等指标,都属于频率型指标,其实质是比例,在流行病 学中也常称为累积发生率。其计算公式可表达为: (5.1) 式中,K为比例基数,可以是100%、1000‰、100000/10万等。比例基数的选择主要根据习惯用法或使计 算结果保留1~2位整数,以便阅读。 例5.1 根据2008年某市健康城市调查数据,研究吸烟与慢性阻塞性肺部疾病(COPD)的关系,结果见表 5.2。试计算该资料中吸烟者与不吸烟者患COPD的患病率。 表5.2 2008年某市吸烟者与不吸烟者的COPD患病情况 患COPD 未患COPD 合计 吸烟 136 2635 2771 不吸烟 161 5409 5570 合计 297 8044 8341 由式(5.1) ,吸烟者COPD的患病率 =4.91% ,不吸烟者COPD的患病率 2.89% ,吸烟者COPD的患病率比不吸烟者COPD的患病率高2.02%。 速率(rate)是带有时间因素的频率,是指随时间变化而改变的速度,此处取其某现象在单位时间内的发生 频率之意。如肿瘤患者的5年生存率、根据追踪随访资料计算的死亡率、年(月、季)发病率等指标,都包 含时间因素,在流行病学中也称为发病密度。速率具有量纲,取值范围是[ ) ,其计算公式可表达 为: (5.2) 式中的比例基数K与式(5.1)相同。 例5.2 在一项随访研究中,对125人追踪随访了2年,结果有2人发生了死亡,则由式(5.2)可得, (二)构成比 构成比(proportion)即比例,是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总 数之比,用以说明事物内部各组成部分所占的比重,常用百分数表示。计算公式为:

文档评论(0)

A13865477551 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档