卫生统计学【2】数值变量资料的统计描述.pptx

卫生统计学【2】数值变量资料的统计描述.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第二章

数值变量资料的统计描述;First;Second;Third;第一节频数分布;2.确定组数n、组距i,并写出组段

频数表的组数是根据研究目的及观察例数确定的,一般设8~15个组段。

组距为相邻两组段下限值之差。相等组距可用极差/组数来估计。常取全距的1/10取整做为组距。本例中若取组数为10,则18.1/10=1.81,取整为2cm,即组距定为2cm。

根据组距写出各组段的起点,即下限,各组段的终点,即上限。第一组段要包括最小观察值,最后一个组段要包括最大观察值。各个组段要从本组的下限开始,不包括本组的上限。;;2000年某地区100名2岁健康男童身高的频数分布;;用SPSS软件绘制频数表;组段;;揭示资料的分布特征和分布类型;

频数分布的两个重要特征:集中趋势和离散趋势

频数分布可分为对称分布和偏态分布

便于发现可疑值;

便于进一步计算指标和统计分析处理;14;第二节数值变量资料的描述指标;描述集中趋势的指标

——平均数average;计算方法

1.直接法

2.加权法;某地区100名2岁健康男童身高均数的计算;;均数的应用:

适用于对称分布资料,因为这时均数位于分布的中心,最能反映分布的集中趋势。

对于正态分布资料,均数更有其重要作用。;几何均数(geometricmean)

用符号G表示

适用条件:常用于等比资料(如抗体滴度资料、医疗费用、人口增长等),尤其是对数正态资料。

;计算方法:

1.直接法:

2.加权法:;例5人的血清滴度为1:2,1:4,1:8,1:16,

1:32,求平均滴度。;抗体滴度;;应用

常用于呈等比数列的资料,即变量值呈倍数关系,尤其适用于对数正态分布的资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布。

计算几何均数时应注意:

1.观察值中不能有0;

2.观察值不能同时有正值和负值,若全是负值,计算时可把负号去掉,得出结果后再加上负号。;中位数median;计算:

1.直接法(小样本资料):

将观察值按大小顺序排列

n为奇数时

n为偶数时

;;例临床观察7名某病患者,其潜伏期(天)各为:2,3,3,5,6,9,16,求其中位数。

例若在上例中增加一例,其潜伏期为20天,求中位数。

;潜伏期

(小时);中位数的应用;附件12012年北京市城镇非私营单位就业人员年平均工资84742元(北京统计信息网)

分行业门类看,年平均工资最高的三个行业分别是金融业184612元,是全市平均水平的2.18倍;信息传输、软件和信息技术服务业130154元,是全市平均水平的1.54倍;科学研究、技术服务业106604元,是全市平均水平的1.26倍。年平均工资最低的三个行业分别是居民服务、修理和其他服务业38838元,是全市平均水平的45.8%;农、林、牧、渔业39334元,是全市平均水平的46.4%;住宿和餐饮业42016元,是全市平均水平的49.6%。最高与最低行业平均工资之比是4.75:1,

;新华社电国家统计局2012年20日首次公布了我国城乡居民人均收入的中位数。2011年,我国城镇居民人均可支配收入中位数为19118元,农村居民人均纯收入中位数为6194元。

国家统计局报告解释说,人均收入中位数是指将所有被调查户按人均收入水平从低到高顺序排列,处于最中间位置的被调查户的人均收入。收入平均数受高收入者和低收入者收入变化的影响较大,而收入中位数相对比较稳健,几乎不受高低两端收入变化的影响。由于居民收入通常呈偏态分布,人均收入中位数一般都低于人均收入平均数。首次发布居民收入中位数,对于社会公众更好把握居民收入分布状态,判断收入变化情况提供了更加丰富的基础数据。;描述离散趋势的指标;全距(range)

亦称极差,用符号R表示,是一组观察值中最大值与最小值之差。

反映个体差异的范围:极差大,变异程度大;极差小,变异程度小。

优点:计算简单,意义明了。

缺点:

1.只反映两个极端值之差;

2.不稳定。;四分位数间距(quartilerange)

用符号Q表示

四分位数(quartile):

第25百分位数P25——下四分位数QL

第75百分位数P75——上四

文档评论(0)

一壶清茶 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档