- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2_第二讲_描述统计方法2011
概论与计量资料统计描述;一、临床统计学概论;一、临床统计学概论;一、临床统计学概论;一、临床统计学概论;变异性的描述:变量;一、临床统计学概论;参数(parameter)与统计量(statistic)表达;二、数值变量资料的统计描述;统计描述的主要用途:
描述样本的基本分布特征
确定参考值范围
发现极端值/离群值
统计描述的基本方法
统计图表法:频数表、直方图、茎叶图、箱图
定量描述法:
集中趋势描述:mean, median, mode, geometric mean
离散趋势描述:range, SD, variance, CV, IQR;(一)、图表描述;1. 频数表;频数表的绘制;频数表;2、直方图:频数分布图;总胆资料的基本特征:
(1)变异的范围2.35-5.8
(2)多数集中在3-5.4之间(3)频数分布基本对称;直条图与直方图的区别;3、茎叶图;血清总胆固醇(mmol/L) Stem-and-Leaf Plot (茎叶图)
Freq Stem Leaf
1.00 2 . 3
.00 2 .
3.00 2 . 677
1.00 2 . 9
5.00 3 . 00011
7.00 3 . 2222233
10.00 3 . 4555555555
8.00 3 . 18.00 3 . 888888999999999999
10.00 4 . 0011111111
9.00 4 . 222222333
11.00 4 . 44555555555
4.00 4 . 6777
6.00 4 . 888899
3.00 5 . 001
4.00 5 . 2233
.00 5 .
1.00 5 . 7
Stem width: 1.00
Each leaf: 1 case (s);4、BOX plot (箱体图);(二)、样本资料的定量描述;1、集中趋势定量描述;算术均数(均数,mean)
性质相同的一组观察值的数量平均水平。
资料满足正态分布或近似正态分布
方法:
直接法:基于原始数据(2.35,2.5,5.8…)
加权法:基于频数表的近似法(利用组中值与频数);注意事项
均数对极端值非常敏感。
利用频数表资料计算均数应慎重。直接法与加权法计算的均数可能有差异,后者为近似估算。
切勿利用均数计算均数。; 在一项高血压干预研究中,某研究者根据治疗分组情况,分别计算相应组别的收缩压平均数:
治疗A组:20例, =17(mmHg)
治疗B组:18例, =21(mmHg)
对照组:62例, =5(mmHg)
三组合并均数:(17+21+5)/3=14.3?
;中位数(median);几何均数; 某地13人接种甲流疫苗后的抗体滴度为1/20,1/20,1/40,1/40,1/80,…1/160,1/320等
取自然对数:
计算对数平均数:1.961
复原几何均数:1:91.4;如某地区居民发汞含量研究(67例);数据资料通过对数转化,直方图如下:
几何均数:6.62;基于统计图表描述结果,确定分布类型;三种集中趋势指标比较:
资料服从正态分布,三种均数值接近,几何均数小于算术均数;
平均数 4.03
中位数 3.98
几何均数 3.99
资料分布对称,中位数与算术均数非常接近。越偏离,则两者的位置相差越远。;中位数;基尼指数:在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比。 ;国家和地区;2、离散趋势的定量描述;描述数值变量资料离散趋势的常用指标
极差或全距(range)
方差/标准差
变异系数
四分位间距;极差(Range)
定义为最大值与最小值之差。
极差大,变异程度大。
由于只考虑两个极端值,稳健性差。
临床研究中常用来作疑似极端值/异常值;方差与标准差(variance and SD)
全面反映了一组观察值的变异程度.
将总体中每个个体值与总体均数之差称为离均差,方差是离均差平方的平均值
为与原始观察值的度量衡单位一致,取方差的平方根后,为标准差。
方差与标准差的数值越大,则表明数值越离散;反之说明较集中在均数周围,均数的代表性越好) 。;以胆固醇研究为例
方差:0.435(mmol/L)2
标准差: 0.66(mmol/L);标准差的用途:描述变异程度、计算标准误、计算变异系数、描述正态分布、估计正常
文档评论(0)