第二章 定量资料的统计描述课件.ppt

第二章 定量资料的统计描述课件.ppt

  1. 1、本文档共98页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第二章定量资料的统计描述;问题1:

何为定量资料?

问题2:

何为统计描述(statisticaldescription)?;统计描述:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。

目的使资料简洁、明了,便于人们了解资料的规律性。;一、变量的频数分布;检查次数;第二章定量资料的统计描述02;频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。

频数分布表(frequencydistributiontable)简称频数表(frequencytable):含有组段与频数的统计表,称频数表。

直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。;2、连续型定量变量的频数分布

问题:

1)何为连续型定量变量?

2)其与离散型定量变量有何区别?

3)连续型定量变量的频数分布表该如何绘制?

;例2-2抽样调查某地120名18岁到38岁健康男性居民血清铁含量(umol/L),数据如下。试编制血清铁资料的频数分布表。;组段;连续型定量变量频数表的编制方法:

1)计算全距(range,R)

R=最大值-最小值=29.64-7.42=22.22

确定组段数(K)与组距

如等组距,则组距=R/K

3)确定组段、计数归表

;图2-2120名健康成年男子血清铁含量频数直方图;0.04;问题:

频数直方图与频率密度直方图的意义是否一样?;潜伏期(小时);图2-4187例某种沙门氏菌食物中毒潜伏期频数直方图;变量频数分布的类型:

1)对称分布

2)偏态分布:

正偏峰(positiveskew)分布(向左偏)

负偏峰(negativeskew)分布(向右偏);变量频数分布的两个特征

1)集中趋势(centraltendency)

2)离散趋势(tendencyofdispersion);二、定量变量的特征数

(描述定量变量的统计指标、或定量变量的数值特征);1、描述集中趋势的统计指标(平均数average)

1)算术均数(arithmeticmean),简称均数

2)几何均数(geometricmean,G)

3)中位数(median,M)

4)众数(mode)

5)调和均数(harmonicmean,H);1)算术平均数:描述对称分布资料的平均水平;月工资x;第二章定量资料的统计描述02;2)几何平均数:个体变化范??越过多个数量级的资料;3)中位数:可用于各种分布的定量资料。指总体中有一半个体

的数值低于这个数,一半个体的数值高于这个数。

对于样本资料,有如下计算公式:

n为奇数时:;对于频数表资料,可用百分位数的方法计算中位数。

百分位数(percentile,Px):

对总体来说,它表示总体中数值小于的Px个体恰有x%。

对样本来说,它表示在按照升序排列的数列里,小于Px的个体数在整个样本中所占百分比为x%。

显然,中位数就是P50。;样本百分位的计算公式为:;4)众数:总体中指出现机会最高的数值;

样本众数则是在样本中出现次数最多的数值。

表2-11998年某地96名妇女产前检查次数频数分布;5)调和均数:先求原始数据的倒数的算术均数,

该算术均数的倒数便称为原始数据的调和均数。;问题:算术平均数与中位数的区别与联系

1、都是用来表示总体的一般水平或分布的集中趋势,都属于抽象化的代表值。

2、代表的意义不同:

算术平均数是对所有变量值来计算的平均数,它能概括反映整个数列中每个变量值的平均水平;

中位数则是根据总体中处于中间位置上的少数变量值来确定的代表值。

从这一点来说,算术平均数对数据的概括能力比中位数显然来的更强一些。;3、与中位数相比,算术平均数对数据变化的“灵敏度”很高。但算术平均数极容易受到个别极端值的影响,即对极端值的“耐抗性”较低。“灵敏度”与“耐抗性”是一对矛盾,实际应用中,可根据这些特点和分析的要求,审慎的选择有关指标。(分布类型)

4、适用资料的类型:算术平均数和中位数均适用于定量资料,但中位数还适用于有序分类资料。;问题:考核甲、乙、丙三个中药店服务员的技术水平,令每人每次从盒中取10克某种中药,各取5次进行称量,结果如下(g):

甲:9.610.510.09.510.4

乙:9.910.19.910.29.9

丙:9.59.59.69.49.4;2、

您可能关注的文档

文档评论(0)

mwq365 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档