网站大量收购独家精品文档,联系QQ:2885784924

数据特征与统计描述.pptxVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第四章数据特征与统计描述

第一节频数分布表与频数分布图第二节计量资料的常用统计指标第三节 计数资料的常用统计指标第四节统计图表本章结构

第一节频数分布表与频数分布图

一、频数分布表(frequencytable)

用途:用于描述资料的分布特征

频数:在一批样本中,相同情形出现的次数称为该情形的频数。资料类型组段频数计数和等级观察结果的所有分类相同类别出现的次数计量根据观察结果重新划分分组统计P44表4-1,4-2,4-3

表4-3某地150名正常成年男子红细胞数(1012/L)编号红细胞数编号红细胞数13.98……24.541434.6734.741445.4045.131455.2954.431464.7764.811475.3874.981485.1583.791494.64……1505.19

1.频数表的编制步骤求极差(range):即最大值与最小值之差,又称为全距。本例极差:R=5.88-3.79=2.09(1012/L)决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一,再略加调整。本例i=R/10=2.09/10=0.209≈0.2。

列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。

组段(1)频数,f(2)组中值,X(3)fX(4)=(2)×(3)3.7~13.83.83.9~44.016.04.1~114.246.24.3~174.474.84.5~264.6119.64.7~324.8153.64.9~265.0130.05.1~185.293.65.3~105.454.05.5~45.622.45.7~5.9合计15.85.8150719.8

三、频数分布图

P47

对称分布:若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布(图4-2)偏态分布:二、频数表和频数分布图用途描述频数分布的类型*

右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。01表4-115名正常成年女子血清转氨酶(mmol/L)含量分布02

左侧的组段数多于右侧的组段数,频数向左侧拖尾。1表4-101名正常人的血清肌红蛋白()含量分布2左偏态分布(负偏态分布):

2.描述计量资料分布的

集中趋势和离散趋势集中趋势(centraltendency):变量值集中位置。本例在组段“4.7~”。——平均水平指标离散趋势(tendencyofdispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。——变异水平指标

3.便于发现一些特大或特小的可疑值*

4.便于进一步做统计分析和处理

描述集中趋势的特征数01描述离散趋势的特征数02第二节计量资料的常用统计指标

计量资料(定量资料、数值变量资料)总体:有限或无限个(定量)变量值样本:从总体随机抽取的n个变量值:X1,X2,X3,……,Xnn为样本例数(样本大小、样本含量)

一、描述集中趋势的特征数(平均指标)总称为平均数(average)反映了资料的集中趋势(centraltendency)。常用的有:

算术均数(arithmeticmean),简称均数(mean)

几何均数(geometricmean)

中位数(median)

例4-21“权数”例4-32符号:总体样本

适用条件:资料呈对称分布,尤其是正态或近似正态。

计算:3直接法4频数表法Σ为求和符号,读成sigma,k,X,f意义5均数(mean)

p49,例4-3:均数=719.8/150=4.8

2.几何均数(geometricmean)几何均数:变量对数值的算术均数的反对数。

适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料01例血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。02此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数均数03几何均数的适用条件与实例

频数表资料的几何均数抗体滴度⑴人数,f⑵滴度倒数,X⑶lgX⑷f·lgX⑸1:41:81:161:32┇1:512合计1562┇572481632┇5120.60210.90311.20411.5051┇2.70930.60214.515

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档