定量资料统计描述课件.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第二章;第一节频数与频数分布

(frequencydistribution);例:某地用随机抽样方法检查140名成年男子的红细胞数;频数表(frequencytable)的编制:

求极差(range):R=Max-Min

=5.95-3.82=2.13

确定组段数、组距和组段

1.确定组段数(k):通常10-15个。

2.确定组距(i):相邻两组段的最小值(下限)之差,一般用等距。i=R/k,一般取整取偶数。

3.确定组限:界限分明,每个组段的起点称下限,终点称上限。最末一行应同时写出下限和上限。

4.列表划记:得到各组段的观察单位数。

;3定量资料统计描述;红细胞数;直方图;频数分布表的用途

可以替代繁琐的原始资料,便于进一步分析;

便于观察数据的分布类型;

便于发现资料中某些远离群体的特大或特小的可疑值;

样本含量较大时,可用各组段的频率作为概率的估计值。;频数分布的类型

对称分布

偏态分布

正偏态:

负偏态:;二、离散型定量变量的频数分布;表2-11998年某地96名妇女产前检查次数分布

检查次数频数频率(%)累计人数累计频率

044.244.2

177.31111.5

21111.52222.9

31313.53536.5

42627.16163.5

52324.08487.5

>51212.596100.0

合计96100;3定量资料统计描述;第二节集中趋势指标;一、算术均数(mean);计算方法

直接法:当样本含量n较小时,可选用此法。设有n个观察值,分别为X1,X2……,Xn,均数的计算公式为:

;例1.10名12岁男孩身高(cm)分别为125.5,126.0,127.0,128.5,147.0,131.0,132.0,141.5.122.5,140.0。求平均数。

;加权法:当样本含量n较大时,一般将观察值分组,列出频数表,再用加权法计算均数。其计算公式为:;3定量资料统计描述;1.编制频数表

(1)求全距:R=183.5-162.9=20.6(cm)

(2)求组段和组距:20.6÷10=2.06,取整数2.0cm为组距;第一组段的下限为162

(3)列出频数表:

表7-1中第3列为组中值X,计算方法是将本组下限和下组下限相加除以2,如第一组X1=(162+164)/2=163,余此类推。第4列fX是频数f和组中值X的乘积。;3定量资料统计描述;2.根据??式计算;二、几何均数

(geometricmean,G);上式计算时需作连乘,还要开n次方,比较麻烦,一般采用对数形式计算。

;例.6份血清抗体滴度为:1:2,1:4,1:8,1:8,1:16,1:32,求平均数。;102名健康人的钩端螺旋体血清抗体平均滴度;三、中位数(median,M);计算方法

直接法:样本含量n较小时,可根据下式计算:;某病患者5人潜伏期分别为2,4,6,7,20,求中位数。本例n=5,为奇数;频数表法:样本含量n较大时计算中位数可用频数表法。将观察资料归纳成频数表,计算累计频数,按下式计算。;107名正常人尿铅含量分布;附:百分位数(PX);对上例的资料计算P25,P75。

求P25,由第4栏可见,第2组的累计频率超25%,该组即P25所在组。;第三节离散趋势指标;两组数据的均数都是100,说明集中趋势相同。但两组数据的分布特征不尽相同,5个数据间的参差不齐的程度不一样。甲组数据的变化范围较小,而乙组数据的变化范围较大,即两组的离散度不同,离散度是一个非常重要的统计指标。

;一、全距(range,R);二、四分位数间距

(quartilerange,Q);三、方差与标准差;3定量资料统计描述;为了消除观察值的总个数N的影响,将离均差平方和除以N,这就是总体方差,用σ2表示。

方差的单位是原度量单位(如kg)的平方,把总体方差开平方,这就是总体标准差,度量单位与原始观察值一致,即

;实际工作中经常得到的是样本资料,总体均数?是未知的,只能用样本均数X代替?。这样用代替,用样本含量n代替N,所得的结果比σ偏小。英国统计学家W.S.Gosset提出用n-1代替n,求

文档评论(0)

mwk365 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档