- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学方法在医学中的应用 中南大学公共卫生学院 副院长 流行病与卫生统计学系 教 授 杨土保 博士生导师 主要内容 基本概念 常用统计方法 统计描述(定量资料、定性资料) 率的标准化 常用统计图表 t检验 ?2检验 秩和检验 直线相关与回归分析 卫生统计学基本概念 总体与样本 总体:表示大同小异的对象(某个测量值)全体。如一个国家的所有成年人(身高值);某地的所有小学生(身高值) 抽样:从研究总体中抽取一部分有代表性的个体的方法; 样本:从研究总体中随机抽取的一部分有代表性的个体; 数据:对样本中个体进行深入的观察与测量,获取的测量值。 卫生统计学基本概念 变量的类型 变量(variable):分成定性(qualitative)与定量(quantitative)两种类型。 ◆定性变量(分类变量(categorical variable)或名义变量(nominative variable)。 例如,职业(工、农、商、学、兵等)是一个分类变量;其可能的“取值”不是数字 卫生统计学基本概念 二分类变量(binary variable),称为0-1变量 例如,性别(男女)、疾病(有无)和结局(生死)等。二分类变量常用0和1来编码,0-1变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算。 卫生统计学基本概念 有序变量(ordinal variable)或等级变量。 分类变量的“取值”中自然地存在着次序。例如,问卷调查常问对某件事情的满意程度:极不满意、有点满意、中度满意、很满意、极满意。有些临床体检或实验室检验常用–、±、+、++和+++来表示测量结果。 卫生统计学基本概念 ◆定量变量 离散型变量(discrete variable):离散型变量只能取整数值。例如,一月中的手术病人数,一年里的新生儿数。 连续型变量(continuous variable):连续型变量可以取实数轴上的任何数值。 “连续”是指该变量可以在实数轴上连续变动,由测量而得到。例如,血压、身高、体重等。 卫生统计学基本概念 统计分析:一定的设计样式决定了一定的数据分析方法;不同设计下获得的资料常常要用不同的方法来分析。 随机化区组设计(randomized block design)的方差分析不同于析因设计(factorial design)的方差分析 病例-对照研究(case-control study),成组对照的资料和匹配对照的资料的分析方法不同 统计描述---定量资料 频数与频数分布 频数:某个测量值的个(例)数。 频数分布表:又称频数表。是将原始数据值适当分组后得到各组的频数。 适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。 定量资料的统计描述 离散型定量变量的频数分布 例2-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,…,4,7等共96个数值 定量资料的统计描述 表2-1:96名妇女产前检查次数分布的频数分布表 定量资料的统计描述 连续型定量变量的频数分布 例:抽样调查某地120名18岁~35岁健康男性居民血清铁含量(μmol/L), 将数据适当分组,计数每组的频数,根据这些数据编制成的频数分布表,则能显示出这组数据分布的特点。 定量资料的统计描述 数据 定量资料的统计描述 手工编制表步骤。 (1)计算全距(range,R),也称为极差 R = 最大值-最小值 = 29.64-7.42=22.22(μmol/L) (2)确定组段数与组距:组段数一般可在10~15之间选择。组距=上限-下限=R/(预计的组段数)。本例如果预计取12个组段,则组距长度约为22.22/12=1.85,取整数2。两端的组段应分别包含最小值或最大值; (3)列表 做出如表2-2的表格,将选好的组段顺序地列在 (1)列。按照“下限≤x<上限” 的原则确定每一例数据x应归属的组段。 定量资料的统计描述 频数分布图:在表基础上,可以绘制出图,称为直方图(频率直方图)。 横轴:血清铁含量 纵轴:频率密度,即频率/组距(直条面积等于相应组段的频率)。 在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。
文档评论(0)