网站大量收购闲置独家精品文档,联系QQ:2885784924

5.医学统计学课件.pptVIP

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
引例: 目的:检验一批药品是否合格。 困难:数量大、检验方法具有破坏性 方法:抽取一部分样品进行检验,从而推 断这批药品的质量。 几个基本概念: 抽样研究:通过样本所携带的信息去估计、推断总体的状态及性质的研究方法称为抽样研究。 抽样研究是统计学的基本方法。抽样是手段,对总体进行估计、推断是目的。 总体参数:反映总体状态或性质的指标称为总体参数。一般用希腊字母来表示,如 μ:总体均数 σ:总体标准差 π:总体率 样本统计量:不含未知参数的样本的函数。 样本统计量主要用于提取样本信息,如 抽样误差:样本统计量和总体参数之间由于抽样引起的差异称为抽样误差。 标准误:表示样本统计量对总体参数离散程度的量。标准误用于度量抽样误差的大小。 均数的标准误的大小与标准差的大小成正比,与样本含量n的平方根成反比。 二、抽样分布 由于样本统计量也是随机变量,因此它也有其概率分布。称样本统计量的分布为抽样分布。 1.均数的抽样分布 设总体X的总体均数为μ,方差为σ2,X1,X2,… Xn是从总体X中抽取的一个样本,则样本均数作为随机变量 其均数为μ,方差为σ2/n。 若从非正态总体X中抽样,则其均数的分布并非正态分布。但当样本含量n较大时,其均数的分布接近于均数为μ,方差为σ2/n的正态分布。 特别地,当总体X的分布为正态分布时,有 2.率的分布: 从一个总体率为π的总体中进行大量重复独立抽样,其样本含量为n,当n充分大时(nπ ≥5或n(1-π) ≥5,且n≥ 40),则样本率P的分布近似于正态分布。 3.t分布 令 则u服从标准正态分布N(0,1)。 当σ未知时,若用S代替σ ,则统计量 服从自由度为ν=n-1的t分布,记为t~ t(ν)。 t分布实际上是一个分布族。下图给出了不同自由度的t分布密度函数图: 关于t分布,我们指出以下事实: 1) 分布特征 由上图可知,t分布的密度函数曲线是单峰的,且关于t = 0对称。 2) t分布与正态分布的关系 从密度函数图还可以看出,t分布密度函数曲线的形状类似于正态分布概率密度函数的图形。 事实上,当ν趋近于无穷大时,t分布近似于标准正态分布,但对于较小的ν ,t分布与标准正态分布相差较大,并且在t分布尾部比在标准正态分布的尾部有着更大的概率。 3) t分布的界值 对于给定的正数(0 α 1),称满足条件: 的点tα(ν)称为t (ν)分布的上α界值点。如图 对于给定的正数(0 α 1),称满足条件: 的点-tα/2(ν)、 tα/2(ν)称为t (ν)分布的双侧α界值点。如图 三、参数估计 1.点估计:直接用样本统计量的值作为相应总体参数的估计值。 如: 点估计的优点是简单、直观;缺点是无法估计误差的大小。 2、区间估计 点估计的实质是用一个数值(样本统计量的值)去估计未知参数的真值。这种估计一般是有误差的。人们希望弄清这种估计的近似程度,这就需要估计出一个范围,并了解这个范围包含未知参数的可信程度,这样的范围在数轴上就是一个区间。这种用一个区间来估计未知参数的方法称为对未知参数的区间估计。 这里提到的可信程度称为可信度或置信度,估计出来的区间称为可信区间或置信区间。 1).总体均数的区间估计 当总体标准差σ已知时,总体均数μ的可信度为(1-α )的可信区间为 当总体标准差σ未知时,总体均数μ的可信度为(1-α )的可信区间为 当总体标准差σ未知,但n足够大时,总体均数μ的可信度为(1-α )的可信区间为 (例5-3) (例5-4) 注1:这里说的可信区间实际上是随机区间,它与抽样结果有关。这个区间能否包含总体均数是一个随机事件,可信度(1-α )的含义是指该区间包含总体均数μ的可靠程度。 注2:评价可信区间的标准主要有两个。一是可信度,即α取得越小,则可信度1-α越高,即该区间包含μ的概率越大;二是估计精度,用区间长度来表示,当然,区间长度越小,则估计精度越高。 一般说来,人们总是希望求得的可信区间的可信度和估计精度都尽可能地好,但是对于固定的样本含量n,二者不可能同时提高。因此,区间估计通常是在保证足够的可信度的前提下,使估计出来的区间长度尽可能地小。若要确保可信度与估计精度同时达到要求,一般说来需要增大样本含量n。 2).总体率的估计 例5-6、5-7 当样本含量n较小时,总

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档