第二讲数据特征与统计描述PPT.ppt

第二讲数据特征与统计描述PPT

;第一节 频数分布表与频数分布图 第二节 计量资料的常用统计指标 第三节 计数资料的常用统计指标 第四节 统计图表 ;第一节 频数分布表与频数分布图; ;表1 某地150名正常成年男子红细胞数(1012/L) ;(3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。;;三、频数分布图 ;二、频数表和频数分布图用途;右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。 ;;左偏态分布(负偏态分布):;2. 描述计量资料分布的 集中趋势和离散趋势;3.便于发现一些特大或特小的可疑值*;4.便于进一步做统计分析和处理;第二节 计量资料的常用统计指标;计量资料(定量资料、数值变量资料) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值: X1,X2,X3,……,Xn n为样本例数(样本大小、样本含量) ;一、描述集中趋势的特征数(平均指标);均数(mean);2. 几何均数(geometric mean);几何均数的适用条件与实例;频数表资料的几何均数;3. 中位数(median);中位数计算公式与实例;频数表资料的中位数;;均数、中位数二者关系;小结: 集中趋势的描述——平均数;二、 描述离散趋势的特征数 (变异(variation)指标); ;1.极差(Range) (全距);2.百分位数与四分位数间距 Percentile and quartile range;频数表资料的百分位数;;百分位数的应用;3.方差;样本方差为什么要除以(n-1);4.标准差;标准差的计算;;5.变异系数(coefficient of variation);变异指标小结;第三节 计数资料的常用统计指标; 计数资料(分类资料): 总体:有限或无限个定性(分类)变量值 样本:从总体中抽取的n个定性(分类)变量值 整理为:分类个体数,即:计数资料频数表 绝对数;一、计数资料的数据整理;按年龄(2岁一组)与职业整理;二、常用相对数;相对比简称比,是两个有关指标之比,说明两指标间的比例关系。 计算公式为 式中两指标可以是绝对数、相对数或平均数。; (一)两个???对数之比: 如某年某医院出生婴儿中,男性婴儿为370人,女性婴儿为358人,则出生婴儿性别比例为370/358×100 = 103,说明该医院该年每出生100名女婴儿,就有103名男性婴儿出生,它反映了男性婴儿与女性婴儿出生的对比水平。 ; (二)两个率之比:如相对危险度(RR)。 例 如某地某年龄组男性吸烟和非吸烟的冠心病 死亡资料如下表,试分析其相对危害度。; (三)两个相对比之比:如流行病学常用的比数比(OR)。 例 服用反应停与肢体缺陷关系病例对照研究资料如表所示: ;比率分子分母都是绝对数,且分子必须是分母的一部分。无量纲,[0,1] 。 1.率(rate)(强度相对数) 说明某现象或某事物发生的频率或强度。 率=(实际发生数/可能发生总数)×比例基数 如:治愈率、病死率、阳性率、人群患病率等 比例基数:100%、1000‰、10000/万、100000(1/10万)等 (按习惯,使结果保留1-2位小数) 例如:患病率通常用百分率、婴儿死亡率用千分率、肿瘤死亡率以十万分率表示。 ;2.构成比(结构相对数)(proportion): 表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用来说明各构成部分在总体中所占的比重或分布。 通常以100%为比例基数。其计算公式为 如:教研室16人高级职称有4人,占25%;中级职称有8人,占50%;初级职称有4人,占25%。;(三)速率(rate): 分母中含有时间量纲。;三、应用注意事项;率与构成比容易误用;2、计算相对数的分母不宜过小。小则直接叙述。 3、进行率的对比分析时,应注意资料可比性。如 比较疗效时,比较组间应病情轻重相同,性别影响,应按性别分组后再作比较。;(1)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。 (2)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较。 ;4、正确求平均率。 例: 若P1=x1/n1 ,P2=x2/n2

文档评论(0)

1亿VIP精品文档

相关文档