5.医学统计学课件.pptVIP

下载本文档

4
0
约2.94千字
约 26页
2019-04-05 发布于北京
举报
版权申诉

5.医学统计学课件.ppt

1、本文档共26页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

引例：目的：检验一批药品是否合格。困难：数量大、检验方法具有破坏性方法：抽取一部分样品进行检验，从而推断这批药品的质量。几个基本概念：抽样研究：通过样本所携带的信息去估计、推断总体的状态及性质的研究方法称为抽样研究。抽样研究是统计学的基本方法。抽样是手段，对总体进行估计、推断是目的。总体参数：反映总体状态或性质的指标称为总体参数。一般用希腊字母来表示，如 μ：总体均数 σ：总体标准差 π：总体率样本统计量：不含未知参数的样本的函数。样本统计量主要用于提取样本信息，如抽样误差：样本统计量和总体参数之间由于抽样引起的差异称为抽样误差。标准误：表示样本统计量对总体参数离散程度的量。标准误用于度量抽样误差的大小。均数的标准误的大小与标准差的大小成正比，与样本含量n的平方根成反比。二、抽样分布由于样本统计量也是随机变量，因此它也有其概率分布。称样本统计量的分布为抽样分布。 1.均数的抽样分布设总体X的总体均数为μ，方差为σ2，X1，X2，… Xn是从总体X中抽取的一个样本，则样本均数作为随机变量其均数为μ，方差为σ2/n。若从非正态总体X中抽样，则其均数的分布并非正态分布。但当样本含量n较大时，其均数的分布接近于均数为μ，方差为σ2/n的正态分布。特别地，当总体X的分布为正态分布时，有 2.率的分布：从一个总体率为π的总体中进行大量重复独立抽样，其样本含量为n，当n充分大时(nπ ≥5或n（1－π） ≥5，且n≥ 40)，则样本率P的分布近似于正态分布。 3.t分布令则u服从标准正态分布N(0，1)。当σ未知时，若用S代替σ ，则统计量服从自由度为ν＝n－1的t分布，记为t~ t(ν)。 t分布实际上是一个分布族。下图给出了不同自由度的t分布密度函数图：关于t分布，我们指出以下事实： 1) 分布特征由上图可知，t分布的密度函数曲线是单峰的，且关于t = 0对称。 2) t分布与正态分布的关系从密度函数图还可以看出，t分布密度函数曲线的形状类似于正态分布概率密度函数的图形。事实上，当ν趋近于无穷大时，t分布近似于标准正态分布，但对于较小的ν ，t分布与标准正态分布相差较大，并且在t分布尾部比在标准正态分布的尾部有着更大的概率。 3) t分布的界值对于给定的正数(0 α 1)，称满足条件：的点tα(ν)称为t (ν)分布的上α界值点。如图对于给定的正数(0 α 1)，称满足条件：的点-tα/2(ν)、 tα/2(ν)称为t (ν)分布的双侧α界值点。如图三、参数估计 1.点估计：直接用样本统计量的值作为相应总体参数的估计值。如：点估计的优点是简单、直观；缺点是无法估计误差的大小。 2、区间估计点估计的实质是用一个数值（样本统计量的值）去估计未知参数的真值。这种估计一般是有误差的。人们希望弄清这种估计的近似程度，这就需要估计出一个范围，并了解这个范围包含未知参数的可信程度，这样的范围在数轴上就是一个区间。这种用一个区间来估计未知参数的方法称为对未知参数的区间估计。这里提到的可信程度称为可信度或置信度，估计出来的区间称为可信区间或置信区间。 1).总体均数的区间估计当总体标准差σ已知时，总体均数μ的可信度为（1－α ）的可信区间为当总体标准差σ未知时，总体均数μ的可信度为（1－α ）的可信区间为当总体标准差σ未知，但n足够大时，总体均数μ的可信度为（1－α ）的可信区间为（例5-3）（例5-4）注1：这里说的可信区间实际上是随机区间，它与抽样结果有关。这个区间能否包含总体均数是一个随机事件，可信度（1－α ）的含义是指该区间包含总体均数μ的可靠程度。注2：评价可信区间的标准主要有两个。一是可信度，即α取得越小，则可信度1－α越高，即该区间包含μ的概率越大；二是估计精度，用区间长度来表示，当然，区间长度越小，则估计精度越高。一般说来，人们总是希望求得的可信区间的可信度和估计精度都尽可能地好，但是对于固定的样本含量n，二者不可能同时提高。因此，区间估计通常是在保证足够的可信度的前提下，使估计出来的区间长度尽可能地小。若要确保可信度与估计精度同时达到要求，一般说来需要增大样本含量n。 2).总体率的估计例5-6、5-7 当样本含量n较小时，总