卫生统计学-卫统4定量资料的统计描述课件.pptxVIP

卫生统计学-卫统4定量资料的统计描述课件.pptx

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

卫生统计学-卫统4定量资料的统计描述课件

定量资料基本概念与特点集中趋势描述指标离散程度描述指标偏态与峰态分布特征描述正态性检验方法及应用场景异常值识别与处理策略contents目录

01定量资料基本概念与特点

定量资料是指用数值大小表示的观察值,通常包括计量资料和等级资料。定义计量资料等级资料用测量或计数手段得到的数值变量,如身高、体重、血压等。将观察对象按照某种属性或特征的程度或等级进行分组,如病情轻重、疗效等级等。030201定量资料定义及分类

数值性连续性离散性可变性定量资料特点分量资料以数值形式表示,可以进行数学运算和统计分析。许多定量资料是连续的,可以取任何数值,如身高、体重等。部分定量资料是离散的,只能取整数或特定数值,如人口数、病例数等。定量资料在不同个体或不同时间可能存在差异,具有可变性。

常见数据类型举例如身高、体重、血压等生理指标,在一般人群中呈正态分布。如医学研究中某些生化指标,可能呈偏态分布。如某疾病的发病率、死亡率等,属于二项分布范畴。如单位时间内某事件的发生次数,符合泊松分布特点。正态分布资料偏态分布资料二项分布资料泊松分布资料

02集中趋势描述指标

定义计算公式适用范围特性算术均数所有观察值相加后除以观察值个数所得的商。适用于对称分布,特别是正态分布的资料。算术均数=总和/观察值个数算术均数易受极端值影响,对于偏态分布资料,算术均数的代表性较差。

0102几何均数定义n个观察值连乘积的n次方根。几何均数计算公式几何均数=(x1*x2*...*xn)^(1/n)中位数定义将一组观察值按大小顺序排列,位于中间位置的数。中位数计算若观察值个数为奇数,则中位数是位于中间的数;若为偶数,则中位数是中间两个数的平均数。适用范围几何均数适用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平;中位数适用于各种分布类型的资料,尤其适用于偏态分布资料和分布不确定的资料。030405几何均数与中位数

0102众数定义一组观察值中出现次数最多的数。众数计算直接观察或计算频数分布表。百分位数定义将一组观察值按大小顺序排列,某一百分位置的数。百分位数计算确定百分位位置,查找对应数值。适用范围众数适用于各种分布类型的资料,常用于描述分类资料的集中趋势;百分位数常用于描述定量资料的观察值在某一百分位置的水平,如百分位数间距可用于描述离散程度。030405众数与百分位数

03离散程度描述指标

一组数据的最大值与最小值之差,反映数据的波动范围。极差上四分位数与下四分位数之差,反映中间50%数据的离散程度。四分位数间距极差与四分位数间距

各数据与均数之差的平方和的平均数,反映数据的离散程度。方差的算术平方根,与原始数据单位相同,更直观地反映数据的离散程度。方差与标准差标准差方差

变异系数标准差与均数之比,用于比较不同单位或均数相差较大的几组数据的离散程度。意义消除单位或均数对离散程度比较的影响,使得不同组数据间的离散程度比较更为客观。变异系数及其意义

04偏态与峰态分布特征描述

偏态分布概念偏态分布是指频数分布不对称,集中位置偏向一侧的分布。根据集中位置偏向的不同,可分为左偏态分布和右偏态分布。判断方法通过计算偏态系数(skewness)来判断分布是否偏态。偏态系数大于0为右偏态,小于0为左偏态,等于0为对称分布。偏态分布概念及判断方法

峰态分布是指频数分布峰的尖锐程度或扁平程度。根据峰的形状不同,可分为尖峰分布、平峰分布和标准峰分布。峰态分布概念通过计算峰态系数(kurtosis)来判断分布是否峰态。峰态系数大于3为尖峰分布,小于3为平峰分布,等于3为标准峰分布。判断方法峰态分布概念及判断方法

对集中趋势的影响偏态分布时,算术均数受极端值影响较大,中位数和几何均数相对稳定。峰态分布时,算术均数相对稳定,但中位数和几何均数可能受极端值影响。对离散程度的影响偏态分布时,标准差受极端值影响较大,四分位数间距相对稳定。峰态分布时,标准差相对稳定,但四分位数间距可能受极端值影响。对统计推断的影响在进行参数检验或非参数检验时,需要考虑样本数据是否服从正态分布或近似正态分布。如果数据呈现明显的偏态或峰态分布,可能会影响检验结果的准确性和可靠性。因此,在进行统计推断前,需要对数据的分布形态进行检验和评估。偏态和峰态对数据分析影响

05正态性检验方法及应用场景

图形法直观判断正态性直方图通过绘制数据的直方图,观察数据分布形态,若呈现钟型或近似钟型,可初步判断为正态分布。P-P图与Q-Q图将数据与理论的正态分布进行比较,若点基本在一条直线上,则数据近似服从正态分布。箱线图通过箱线图判断数据分布的偏态和异常值情况,辅助判断正态性。

数值法精确检验正态性适用于大样本数据,通过比较经验分布函数与

文档评论(0)

zsmfjy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档