- 1、本文档共63页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
02 第二章 定量资料的统计描述PPT
;;第二章 定量资料的统计描述; [学习要求]
熟悉:定量资料频率表的编制方法和用途。
掌握:
集中趋势指标:算术均数、几何均数、中位数;
离散趋势指标:极差、四分位间距、方差、标准差、变异系数。
两种描述指标的计算方法和适用条件; 第一节 频率分布表与频率分布图
医学研究资料变量值的个数较多时,对各变量值出现的频数或频率列表即为频数分布表或频率分布表(frequency distribution table),简称频数表或频率表。; 一、离散型定量变量的频率分布
例2-1 1998年某山区96名孕妇产前检查次数资料,编制频率表。
表2-1 1998年某地96名孕妇产前检查次数频率分布; 图2-1 1998年某地96名孕妇产前检查次数频率分布;二、连续型定量变量的频率分布;频率表的编制步骤如下:
1. 计算极差 (range, R),亦称全距,即最大值与最小值之???。
本例最大值29.64,最小值7.42 (借助excel等数据管理软件)
故R=29.64-7.42=22.22 (μmmo/L)。
2. 确定组段数与组距(class interval)
组段数一般取10组左右。
组距用 i 表示,组距=极差/组段数,
本例拟分10组,i=22.22/10=2.22,
一般取靠近的整数作为组距,本例取i=2。 ;频率表的编制步骤如下:
3. 确定各组段的上、下限
每个组段的起点称为组段的下限,终点称为组段的上限。
第一组段要包括最小值,本例取6为第一组段的下限(也可取7),
最后一个组段要包括最大值。
注意各组段不能重合,每组段只写出下限,如6~,8~,
最后一个组段可包括其上限值,如本例28~30。
4. 列表
清点各组的频数,计算频率、累积频率数和累计频率。 ;组段
(1);图2-2 某年某地120名18~35健康男性居民血清铁含量(μmmo/L)频率分布
;图2-2 某年某地120名18~35健康男性居民血清铁含量(μmmo/L)频数分布
;三、频率分布表(图)的用途
1、揭示资料的分布类型 ; 正偏态(右偏态);第二节 描述集中趋势的统计指标;简称均数。
1、表示符号:
希腊字母 -----总体均数(population mean)
----- 样本均数 (sample mean)。
2、适用条件:均数适用于对称分布或近似对称分布的资料。
3、计算方法:直接法和频率表法(亦称加权法)。;(1)直接法
; (2)频率表法(加权法) 当变量值的个数较多时,在编制频率表的基础上,应用加权法计算均数的近似值。;表2-4 120名18~35健康男性居民血清铁含量(μmmo/L)算术均数计算(频数表法); 1、表示符号:G
2、适用条件:
(1)适用于原始变量不呈对称分布,但对变量经对数转换后呈对称分布的资料,又称对数正态分布资料。
常见于正偏态分布资料,如抗体滴度,某些传染病的潜伏期,细菌计数等。
(为什么呢?看下一页的实例图)
(2)数据的数量级差别很大的资料。 ;
;
; (1)直接法
公式:
对数的形式为 ;本例先求平均滴度倒数的几何均数; (2)频率表法:当资料中相同变量值的个数f(即频数)较多时,可通过频率表法计算几何均数,公式为
;本例Σf lgX= 108.06977 , Σf=52,代入公式得 ; 1、中位数(median , M)
(1)定义:
将一组变量值从小到大按顺序排列,位次居中的变量值。
在全部变量值中,大于和小于中位数的变量值的个数相等。
(2)适用条件:
①变量值中出现个别特小或特大的数值;
②资料的分布呈明显
文档评论(0)