- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章定性资料的统计描述
一、定性资料的频率分布
(一)多分类变量的频率分布
例5-1 某课题组为了解城市中不同人群的吸烟状况,用随机抽样的方法
于2010年对某城市10种不同职业的人群共11085人进行了调查。通过对数
据的整理,将11085例调查对象和3918例吸烟者按职业分组制成频数表
(表5-1)
2
3
表5-1的第(1)栏“职业”是一个多分类变量,第(3)
栏显示本次调查的被访者不同职业的频率分布;表5-1的第
(5)栏是本次调查得到的吸烟者在不同职业的频率分布。
频率分布的特点是,定性变量各类别的频率之和为
100%。
4
(二)二分类变量的频率分布
表5-2是一个二分类变量频率分布,它描述的是例5-1所调查的
11085例被访者中吸烟与否这个二分类变量。
描述一个二分类变量的分布只需一个频率就够了。
5
二、常用相对数指标
6
一、构成比
构成比(proportion):构成指标,表示某一事物内部各组成部
分的比重或分布,常用百分数表示。
某一组成部分的观察单位数
构成比 100%
同一事物各组成部分的观察单位总数
7
例5-2 为了解社区居民高血压的患病情况,研究人员对某社区居民
进行了调查,结果如表5-4 。
8
如表5-4中的第(4)列患病人数构成比,其中 “20~”岁年龄组的
患病人数占患病总人数的比重=(57∕460)×100%=12.4%。依
次可求出 “30~”岁、 “40~”岁、 “50~60”岁各组患病人数占
患病总人数的比重分别为30.2%、32.4%和25.0%。可见在全部患病
人数中,以 “40~”岁组患者所占比重最大。
9
二、率
率(rate):又称频率指标,说明某事件发生的频率。
某时期内发生某事件的观察单位数
率 K
同期可能发生某事件的观察单位总数
其中,K 是一个等于1的比例基数,通常为100%,也可取1000‰、
10000/万和100000/10万等。
10
如表5-4中的第(5)栏患病率,其中 “20~”岁年龄组的高血压患
病率为该年龄组患病人数除以该年龄组检查人数,即(57∕800)
×100%=7.1%,表示的是该社区受检人群中 “20~”岁年龄组高
血
文档评论(0)