- 2
- 0
- 约5.37千字
- 约 44页
- 2023-10-20 发布于江苏
- 举报
Medical statistics
医学统计学
统计资料的整理与描述 数值变量资料
. 个体变异
. 频数分布表(图)
. 定量指标的描述
– 集中位置
– 离散趋势
. 总结
主要内容
柏建岭讲稿
• 是同质观察对象间表现出的差异。
• 变异是生物体在一种或多种、已知或未知的不可 控因素作用下所产生的综合反映。
• 就个体而言:变异是随机的(random)。
• 就总体而言:个体变异是有规律的。
个体变异(individual variation)
柏建岭讲稿
3
2023/ 10/12
100名成年男性血红细胞计数(1012/L )资料如下:
原始数据
柏建岭讲稿
2023/ 10/12
4
. 原因: 由于个体变异的存在,医学研究中某指标
在各个体上的观察结果不是恒定不变的,但也不
是杂乱无章的,而是有一定规律的,呈一定的分
布(distribution)。
. 解决: 频数分布表的基本思想:将原始数据按照 一定的标准划分为若干各组,合计各组的频数, 得到频数分布表;在将频数表绘制成频数分布图。
频数分布表和频数分布图
频数表编制步骤
. 求极差
. 选定适当的组段数后估计组距
. 列出组段
. 划记归组获得频数
. 求频率,完成频数表
柏建岭讲稿
频数分布表的编制
. 求极差或全距(Range) : R=Xmax-Xmin
– R = 6.18-3.29=2.89
. 选定适当的组段数后估计组距( i )
– 组段数的选取以能反映资料的分布特征为宜
– 一般取8 ~ 15组
– i =2.89/10=0.289≈0.3
柏建岭讲稿
频数分布表的编制
. 列出组段
– 组段的含义 : 包括组段的下限而不含组段的上限 。如: 3.20~ 等价于 [3.20 ,3.50)
– 第一个组段应包含最小值
– 最后一个组段应包含最大值
柏建岭讲稿
2023/ 10/12
8
频数分布表的编制
. 划记归组获得频数
– 常用的划记方法: “正” ;“ ||||”
. 求频率,完成频数表
– 相应的频数除以总数即为频率
– 各组段的频率总和为1或者100%
柏建岭讲稿
100名成年男性血红细胞计数频数表
100名成年男子红细胞计数频数图
3.2 4.1 4.4 4.7 5.0 5.3 5.6 5.9 6.2
血红细胞(1012个/L)
图2.1 100名成年男性的血红细胞计数的频数分布
3.5 3.8
人数
20
10
15
11
5
0
. 描述分布类型
. 描述分布的特征
. 便于发现特大、特小的可疑值
. 便于计算有关指标、统计分析与处理
频数分布表和频数分布图的用途
柏建岭讲稿
2023/10/12
12
频数分布类型
. 对称分布:以正态分布较为常见
. 非对称分布: 偏态分布
– 正偏态:右侧左侧
– 负偏态:左侧右侧
向右侧拖尾
向左侧拖尾
柏建岭讲稿
2023/ 10/12
13
频数分布特征
. 数据分布的范围: 3.29~6.18
. 集中位置:中等大小人数居多,向中间集中
–数据最集中的区间: 4.70~5.00
. 离散趋势:以中等大小的区间为中心,向两侧逐渐减少
. 分布形态: 基本对称
柏建岭讲稿
1 3 5 7 9 11 13 15 17 19 21
发汞含量(umol/kg)
239人发汞含量的频数分布
70
60
50
40
30
20
10
0
柏建岭讲稿
人 数
2023/10/12
图
15
某城市892名老年人生存质量自评分的频数分布
柏建岭讲稿
0 10 20 30 40 50 60 70 80 90 100
200
100
0
自评分
人 数
2023/10/12
图
300
400
16
图 102名黑色数瘤患者的生存时间频数分布
柏建岭讲稿
40
30
20
10
1 5 10 15 20 25 30 35 40 45
生存时间(月)
2023/10/12
数
人
17
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
死亡年龄(岁)
图 某地1990~1992年男性死亡年龄分布
柏建岭讲稿
1500
1000
原创力文档

文档评论(0)