卫生统计知识点汇总.doc

卫生统计知识点汇总

PAGE PAGE 27 第一讲 绪论 总体:是研究目的所确定的所有同质个体某指标实际值的集合;或说, 总体是根据研究目的确定的所有同质观察对象的全体。 样本:根据随机化的原则从总体中抽取有代表性的部分观察单位,其变量实测值构成样本。 样本含量:样本所包含个体或个体值的个数。 抽样(Sampling) :从总体中抽取有代表性的一部分样本的过程,称为抽样。 抽样研究:从确定的同质总体中随机抽取部分样本进行观察,用样本信息来推断总体特征,该研究方法叫抽样研究。 统计推断:样本的现象推断所研究总体的特征。即分析样本数据,获得关于总体的知识。 同质(homogeneity):指研究对象在一定范畴的各种可能影响主要观察指标的其它因素处于相同或非常相似的情况,即把具有相同性质的观察单位简称为同质的(homogeneous),否则称为异质的(heterogeneous) 。 变异(variation):同质基础上的各观察单位间的差异 参数:根据总体变量值统计计算出来,描述总体特征的统计指标。 统计量:根据样本个体值统计计算出来,描述特征的统计指标。 变量:变异性表现为取值上的大小就是变量。通常把观察单位的观察指标称为变量。如身高、体重等 变量值:观察单位 的观察值 叫变量值,如身高 118cm,体重26kg 等。 误差:为观察值(X)与实际值(μ)之差。 抽样误差(sampling error) :由抽样造成的样本统计量和总体参数的差别、以及样本统计量之间的差别称为抽样误差。 随机事件(Radom event):随机试验中可能出现的各种结果,叫随机事件。即在一定条件下具有多种可能发生的结果,而究竟发生那一个结果不能肯定,又称偶然事件。 概率(Probability):描述随机事件发生的可能性大小的一种度量,常用P 表示。 小概率事件:当随机事件A的概率P(A)≤a,习惯上,当a=0.05时,就称A为小概率事件;其统计学意义是小概率事件在一次随机试验中不可能发生。 频率(Frequency):在n次试验中,若事件A发生的次数为m,则: m称为事件A在n次试验中的频数,fn(A)称为事件A在n次试验中发生的频率。 统计描述:用统计指标、统计表、统计图等方法,对样本资料的数量特征及其分布规律进行描述 统计推断:指用样本信息推断总体特征,包括参数估计和假设检验。 第二讲:数值变量的统计描述 一、频数表与频数分布图 (一)基本概念: 频数( frequency ):指在一个抽样资料中,某变量值出现的次数。 频数分布表(frequency distribution table):将各数值变量的值及其相应的频数列表,简称频数表。频率是表示频数出现机率的指标,可用百分数或小数表示,频率为100%或1。 频数分布图(frequency distribution figure) :根据频数分布表,以变量值为横坐标,频数为纵坐标,绘制的直方图。 (二)连续型变量频数表的编制方法: ⒈ 求全距(Range,简记R ):是一组资料中最大值(Xmax)与最小值(Xmin)之差,亦称极差。 2. 定组距:将全距分为若干段,称为组段。组与组之间的距离,称为组距;用小写i 表示。 原则:(1)“组段”数一般为10-15个; (2)“组距”一般为R/10取整; (3)为计算方便根据组距采取取整数方法 3.写组段:即将全距分为若干段的过程。 原则:(1)第一组段要包括Xmin,最末组段包括 Xmax ; (2)每组段均用下限值加 “~ ”表示,最终组段同时注明上下限。 4. 列表划记:根据预定的组段和组距,用划记的方法整理原始资料。 (三)频数表的用途: 1.揭示频数的分布特征:集中趋势与离散趋势结合能全面反映频数的分布特征 2.揭示频数的分布类型 对称分布 : 集中部位在中部,两端渐少,左右两侧的基本对称,为对称(正态)分布。 正偏 : 集中部位偏于较小值一侧(左侧),较大值方向渐减少,为正偏态分布。 负偏 : 集中部位偏于较大值一侧(右侧),较小值方向渐减少,为负偏态分布。 3.便于发现某些特大或特小的可疑值。 4. 样本含量足够大时,以频率作为概率的估计值。 5.作为陈述资料的形式。 二、集中趋势的指标 集中趋势:用于描述一组计量资料的集中位置,说明这种变量值大小的平均水平,常用平均数(average)表示。 注意:1.同质的事物或现象才能求平均数 2.应根据资料分布状态选用适当的均数。 算术均数 : 单峰对称分布 包括 几何均数 : 对数正态分布 中位数、百分位数 : 偏态分布 (一) 算术平均数(arithmetic mean)

文档评论(0)

1亿VIP精品文档

相关文档