- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
csy_1124_医学统计学-chapter1
第一章 描述性统计
统计描述的任务就是用表、图和数字的形式概括原始资料的主要信息。
频数表与直方图:
频数表与直方图是最常用的综合描述样本资料的方法, 形象直观,可大致看出分布。
1. 频数表的制作:
例1.3 某地随机抽取正常成年男子120名, 其红细胞计数值(1012 /L)如下:
5.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.84
…
4.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69
试作该批样本的频数表。
对计量资料则要按以下步骤制作频数表
(1)找出最大和最小值,计算极差。
本例最大值=6.18, 最小值=3.29,极差为R=6.18-3.29=2.89
(2)确定组距和列出分组计划:一般设10~15组;组距取整。
i= R /10=2.89/10=0.289≈0.30
第一组包括最小值,最后一组包括最大值。
(3)将原始数据整理后,得到各组频数。
2.频数表的用途:
(1)描述资料特征: 集中趋势及离散趋势。
(2)确定变量的分布类型
(3)发现异常值
二、样本平均水平的度量
用更精确的一、两个数字(指标)描述原始资料的信息,对于计量资料一般用两个数字(指标)分别描述资料的平均水平和变异性。
常用描述平均水平的指标有算术均数、几何均数和中位数。
1. 算术均数(arithmetic mean),简称均数。
适用:对称资料,最好是近似正态分布的资料。
计算:
①直接法:
例如:测量7名正常8岁女孩身高(cm)分别为:
122 129 128 135 132 125 133
平均身高为:(122+ 129+128+135+132+125+133)/7=129(cm)
②加权法:当数据量太大时或资料已经整理成频数表时。
2. 几何均数
适用:原始数据经对数转换后近似对称分布的资料,医学上常用于微生物学和免疫学指标。
几何均数的计算可参考算术均数的计算,唯一不同的是需要在计算前将变量取对数,最后将结果反对数转换回其真值。
3. 中位数 (median)
将一组观察值从小到大排列,位置居中的那个数值为中位数。
适用:数据为非对称分布﹑分布不清楚或资料未闭口的情形。
计算:
①直接法:将原始数据 ,由小到大排序,
例:1,1,2,2,3,4,6,9,10 ( n = 9, 为奇数)
Md = 第5位 = 3
例: 1 , 1 , 2 , 2 , 3 , 4 , 6 , 9 , 10 , 13 ( n=10, 为偶数)
Md = 第5位和第6位的平均 = (3+4)/2
②频数表法:
组段 频数 累积频数 组中值 1~ 20 20 2 3~ 66 86 4 5~ 60 146 6 7~ 48 194 8 9~ 18 212 10 ... ... ... 19~21 3 239 20 合计 239
(1) 中位数的名次 n / 2 = 239 /2 = 119.5
(2) 该名次所在组段 a ~ b = 5 ~ 7
(3) 用插入法 :
a 和 b 所对应的累积频数 fa =86 , fb = 146
在a 和 b 中作插值估计
三、样本变异性的度量:
例:三组同年龄﹑同性别儿童体重(kg)数据如下:
甲组 26 28 30 32 34
乙组 24 27 30 33 36
丙组 26 29 30 31 34
常见的几种:极差或全距,四分位数差距,方差与标准差,变异系数
1. 极差或全距R
极差 = 最大值 - 最小值
2. 四分位数差距Q
四分位数差距 = X75 - X25
中位数是50%位数,因此四分位数的计算类似中位数。
3. 方差S2与标准差S
适用:对称分布或近似正态分布资料,能充分利用全部个体的信息。
离均差 = 个体值- 总体均数 =
离均差平方和 = ( ()2
总体方差 =( ()2 /n
总体标准差
总体均数常不知道,用样本均数
文档评论(0)