医学统计方法(二)复习要点.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学统计方法(二)复习要点 抽样研究的目的就是通过样本的信息了解总体的情况。 个体是统计分析根据研究目的所确定的最基本的研究对象单位,所以个体又称为观察单位。 同质具有相同性质的观察单位称为同质的,否则,称为异质的。 变量 就是观察指标。变量取值表示观察值(或测量值)或对应的观察结果,亦称资料(data)。资料分为计量资料和计数资料。有些计数资料可以认为是分类资料:分类资料又分为有序分类和无序分类。 计量资料:亦称连续型资料。在测量精度无限制的情况下,一个区间中的任意值都可以是可能的观察值,并且通常计量资料含有测量单位。无序分类资料:表示互不相容的类别或属性。包括(a)二分类资料(b)多分类资料。显然X的取值仅是起指示分类的作用,其数值大小并无实际意义。无序分类资料的分析应先按类统计汇总,统计每一类的观察单位数,并将按类汇总的统计结果编制成表格形式的资料,这种汇总后的资料又可称为计数资料。有序分类资料:资料不仅表示互不相容的类别而且表示各类在研究背景意义下的等级顺序,因此具有“半定量”意义。所以观察有序分类变量所得资料又称为等级资料。有些观察指标,例如白细胞计数,其取值虽然是离散的,但不具有分类的性质,因此通常把这类观察指标的资料作为较为特殊的计量资料。 总体(population) 是根据研究目的确定同质个体的全体。总体分为有限总体(finite population)和无限总体(infinite population)。 样本 在一个较大范围的研究对象中随机抽出一部分个体进行观察或测量,这些个体的测量值构成的集合称为样本(sample),样本中的个体总数称为样本量(sample size)。 频率(frequency):考察某个可能的结果,若在n次观察中,有m次观察到这种可能的结果,则称这种可能的结果发生的比例为频率,m称为频数。显然有。频率f是一个随机抽样观察的结果,因此频率f呈一定的随机波动。 概率(probability):概率刻画随机事件发生可能性大小,其取值界于0和1之间。随机事件发生的可能性越小,概率越接近0;随机事件发生的可能性越大,概率越接近1。特别,不可能事件发生的概率等于0,必然事件发生的概率等于1。 概率与频率的关系:A是一个随机事件,进行了n次随机试验,随机事件A发生了m次,则随机事件A发生的频率为,当时,随机事件A发生的频率趋向一个常数?,这个常数?就是随机事件A发生的概率。记为P(A)。 在统计学中,如果随机事件发生的概率小于或等于0.05,则认为是一个小概率事件,表示该事件在大多数情况下不会发生,并且一般认为小概率事件在一次随机抽样中不会发生,这就是小概率原理。小概率原理是统计推断的基础。 如果资料近似呈对称分布,则用 均数?标准差 描述 如果资料呈偏态分布,则用 中位数(P25——P75)其中P25,P75为百分位数中的第25%百分位数和第75%百分位数。 正态分布的两个参数? 与 ? ,参数? 是正态总体的均数,它描述了正态分布的集中趋势位置。参数? 是正态总体的标准差,它描述正态分布的离散程度,? 越小,分布越集中, ? 越大,分布越离散。不同的、不同的,对应于不同的正态分布。通常用记号表示均数为,标准差为的正态分布。若?=0,?=1的正态分布称为标准正态分布。记为N(0,1)。 标准正态分布是一种特殊的正态分布,其均数为0,标准差为1。常用u或z表示标准正态分布变量。变换: (2.19) 被称为是标准化变换,因为若变量X服从正态分布,则就服从标准正态分布。 样本均数与总体均数之间的差异被称为均数的抽样误差(sampling error)。抽样误差是由个体变异和抽样引起的,因此,只要有个体变异,抽样就必将导致抽样误差,即抽样误差是不可避免的。抽样误差有两种表现形式,其一是样本统计量与总体参数间的差异,其二是样本统计量间的差异。随着样本含量的增大,样本均数的频数图范围越来越窄。 样本均数的总体标准差=。为了区分样本所在总体的标准差,通常称样本均数的标准差为样本均数的标准误(简称均数标准误),记为。故样本均数与个体资料所在的总体变异程度有如下规律: 用样本标准差S估计总体标准差?,利用上述公式得到均数标准误的估计式 为了叙述方便,常称为标准误,称为理论标准误。 小样本时,t统计量和U统计量的分布是有明显差别的,但在大样本时,t统计量和U统计量的分布非常接近。t分布与正态分布的关系:自由度v较小时,t分布与标准正态分布相差较大,并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积。当自由度时,t分布逼近于标准正态分布。从频数图(图3.4)也可以看出,当样本

文档评论(0)

liwenhua00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档