卫生统计学-第一节统计学的几个基本概念.docVIP

卫生统计学-第一节统计学的几个基本概念.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
卫生统计学-第一节统计学的几个基本概念

卫生统计学 第一节 统计学的几个基本概念 一、统计工作的步骤 统计工作的步骤包括:统计设计、收集资料、整理资料和分析资料。其中统计设计是最关键的一环,是后续步骤的依据。统计资料主要来自:①卫生统计报表;②经常性工作记录;③专题调查或实验研究。整理资料的目的是净化原始数据,使其系统化、条理化。分析资料即通过计算统计指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断两部分。统计描述是指运用统计指标如平均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推论总体的问题;统计推断是指一定的可信程度或概率保证下,根据样本信息去推断总体特征。 二、统计学中的几个基本概念 (一)资料的类型 1.定量资料 亦称计量资料,其变量值是定量的,表现为数值大小,一般有度量单位。如调查某年某地7岁女童的生长发育状况,以人为观察单位,女童的身高(cm)、体重(kg)、血红蛋白(g/L)等均属于定量资料。定量变量可以分为两种类型:离散型变量和连续型变量。离散型变量只能取整数值。例如一月中的手术病人数,一年里的新生儿数。连续型变量可以取实数轴上的任何数值。有些变量的数值由测量得到,他们大多属于连续型变量。例如身高、体重等。 2.定性变量 亦称为分类资料、分类变量或者名义变量。其观察值是定性的,表现为互不相容的类别或属性,例如职业是一个分类变量,其可能的“取值”不是数字,而是工、农、商、学、兵等。 (1)无序分类资料:①二分类变量,结果为阳性与阴性两类,表现为互不相容的两类属性,如性别、疾病和结局等。②多项分类。如血型,表现为互不相容的过个类别。 (2)有序分类资料:各类之间有程度的差别,给人以半定量的概念,亦称等级资料。如极不满意、有点满意、中毒满意、很满意、极满意等。 有时为了数据分析的方便,人们将一种类型的变量转化为另一种类型。但变量只能由高级向低级转化:连续型→有序→分类→二值;不能作相反方向的转化。离散型变量常常通过适当的变换或连续性校正后借用连续型变量或有序变量的方法来分析。 (二)总体与样本 总体:就是所有同质观察单位某种观察值(即变量值)的集合。 样本:是总体中随机抽取的部分观察值的集合。 抽样:从研究总体中抽取一部分有代表性的个体的手段。 统计推断的工具是有关概率的理论。如果某事件的结果具有多样性的,事先不能肯定,人们就用一系列概率来描述出各种结局的可能性。既然是推断,既然是由部分推断全体,统计学的结论从来就不是完全肯定或者完全否定的。能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术,这些是统计学的核心内容。 (三)、参数与统计量 参数:表示总体分布特征的统计数字,用于描述总体特征的指标,由总体观察值计算而来。 同一总体的个体彼此之间的差异具有一定的规律性。通常用变量取值的分布来全面反映这种规律性。为了便于处理实际问题,统计学中常用若干典型的分布模型来近似地描写实际资料,例如,正态分布、二项分布、和泊松分布等,常称为统计模型。 理论上,正态分布有两个参数:总体均数和总体方差,一旦知道这两个参数的数值,我们就完全了解相应的正态分布;这两个参数的大小是客观存在,然而往往是未知的,我们需要通过样本资料来估计这两个参数。观察样本中的个体,我们获得一批数据,计算他们的均数,得到样本均数。这种由观察资料计算出来的量称为统计量。我们用样本均数这个统计量来近似地反映总体均数这个参数。总之,统计学关心的常常是总体参数的大小,其依据却是统计量及其性质。 在抽样研究中,由个体变异产生,随机抽样引起的样本统计量与总体参数之间的差别称为抽样误差。 一个总体中有许多个体,他们之所以汇集起来共同成为人们研究的对象,必定存在共性。我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。然而,同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 统计学的任务就是在变异的背景上描述同一总体的同质性,揭示不同总体的特异性。 (四)概率和频率 概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某时间发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 在现实中,随机事件的概率往往是未知的,因此,当观测单???足够多时,常用样本中事件的实际发生率来估计总体概率,这种实际发生率称为频率。在相同条件下,独立重复进行n次试验,事件A出现f次,则事件A出现的频率为f/n。如治疗200例患者,120名患者治愈,治愈率为60%,这就是一个频率。当观测单位较少时,用频率估计概率是不可靠的。

文档评论(0)

ktj823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档