卫生统计学专题四:定量资料的统计描述.docVIP

卫生统计学专题四:定量资料的统计描述.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学专题四:定量资料的统计描述.doc

专题四 定量资料的统计描述 一、频数表与频数图 频数表:表达变量取值及其不同取值频数分布情况的统计表。 ⒈频数表的编制 ⑴连续型定量资料的频数表 ①求极差(全距):R=xmax-xmin ②确定组数和组距: 根据样本含量的大小及研究目的确定组数,一般设为8~15组。用R除以组数得到的商,取与此接近较为整齐的数值作为组距,组距即为各组的上、下限之差。 注:各组的组距可以相等,可以不等,一般多采用等距分组。 ③确定组段:即确定每一组的起点和终点(下限与上限) 注:⒈第一组段包括全部观察值中的最小值,最末组段包含全部观察值中的最大值;⒉各组段包含的数值范围是大于等于下限,小于上限;⒊频数表中除最末组同时写出下限和上限外,其余各组均只写出下限; ④归组计数整理成表; ⑵离散型定量资料的频数表的编制:将变量值及其对应的频数列出即可。 ⒉频数表的用途 ⑴揭示资料的频数分布特征和频数分布类型: ①分布特征:集中趋势、离散趋势,对于定量资料可从两个方面去描述其分布特征。 ②分布类型:对称分布,即高峰位中,两侧对称。 偏态分布,高峰偏于一侧,偏向数值小的一侧,称为正偏态分布;偏向数值大的一侧,为负偏态分布。 ⑵便于发现某些特大或特小的可疑值; ⑶便于进一步计算指标和统计处理。 ⒊频数图:更直观、形象。 以变量值为横坐标,以频数为纵坐标(等距分组时可以频率为纵坐标,不等距分组时以频率/组距=频率密度作为纵坐标),即每个等宽长方形面积表示每组频数(或频率)。 注:连续型定量资料,其频数图中各长方形是相连的,又称为直方图;离散型定量资料,其频数图中各长方形是间隔的,又称为直条图。 二、集中趋势的描述 对于定量资料集中趋势的描述常用平均数,平均数表达了一组同质定量数据的平均水平或集中位置。 算术平均数(均数) 几何均数(倍数均数) 符号 (样本),μ(总体) G 计 算 方 法 (直接法) (加权法) k为组段数,xk为各组段相应频数。 (直接法,用于样本含量较少时) G= =lg-1 =lg-1 (加权法,用于观察值较多,或资料已编成频数表时) G=lg-1 =lg-1 应用 应用于对称分布,特别是正态分布资料集中趋势的描述。 ①对数对称(含对数正态分布),即数据经对数变换后呈对称分布或正态分布的资料。 ②等比级数资料,即观察值之间呈倍数或近似倍数变化的资料,如抗体滴度、抗体效价。 说明 计算几何均数时,观察值中不能有0,因为0不能取对数,此时可以加上1个很小的数,算后再减去该数值即可。观察值不能同时有正有负。 续表 中位数 百分位数 符号 M Px 计 算 方 法 观察个数为奇时,M=x 观察个数为偶时, (直接法)M= (频数表法)M=L+ L为频数表中M所在组段的下限,i为M所在组段的组距,fM为M所在组段的频数,∑fL为小于L的各组段累积频数。 Px=L+ 其中L为Px所在组段下限,i为组距,fx为Px所在组段频数,∑fL为小于L的各组段的累积频数。 应用 适用于描述偏态分布资料、一端或两端无确切值的资料及总体分布不确定资料的集中趋势 ①用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可全面描述一组观察值的分布特征; ②用于确定非正态分布资料的医学参考值范围。 说明 ①将观察值由小到大排序后,居于中间位置的数值。 ②在全部观察中,小于和大宇中位数的观察值个数相等。 ①Px是指将观察值由小到大排序后,将其平均分为100份,对于每一分割位置上的数值即为一个百分数。 ②四分位数:P25(Ql)、P50(中位数)、P75(Qu); ③应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数。 三、离散趋势的描述 离散趋势,反映了观察值之间的变异情况。 极差 四分位数间距 方差 符号 R Q σ2(总体),s2(样本) 计 算 方 法 R= Q=Qu-Ql=P75-P25 σ2=离均差平方和/N= ∑(x-n)2 N s2= ∑(x-)2 (n-1为自由度) n-1 应用 仅用于初步了解资料的变异程度,概括地描述全部数据所在范围。 描述偏态分布以及分布的一端或两端无确切数值资料的离散程度。 描述对称分布,特别是正态分布或近似正态分布资料的离散程度。 说明 ①R大,反映了全部观察值所在范围的变异程度大,数据较为分散;R小,反映了全部观察值所在范围的变异程度小,数据较为集中; ②不能反映组内其他观察值的变异程度。 不受两端极大值或极小值影响,较全距稳定,但仍不能概括所有观察值的变异情况。 相同指标,方差越大,说明数据围绕均属分布越分散,变异程度越大;反之,方差越小,说明数据围绕均属分布越集中,变异程度越小; 续表 标准差 变异系数 符号 σ(总体),

您可能关注的文档

文档评论(0)

cnsg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档