[2018年最新整理]5-参数估计.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[2018年最新整理]5-参数估计

医学统计学 Medical Statistics 第三章 抽样误差 随机化抽样研究 统计推断:用样本信息去推断总体的特征 参数估计 假设检验 一、抽样误差的概念 某地成年男子血红蛋白的总体均数 ? =13.76(g/100ml),研究者随机抽查了360名男子,平均血红蛋白含量为13.45,若作为该地区成年男子血红蛋白总体均数(? )的估计值,则与实际总体均数相差0.31。 由于随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。 在抽样研究中抽样误差是不可避免的。 抽样误差的表现形式 样本统计量≠总体参数 样本统计量1 ≠样本统计量2 二、抽样误差产生的条件 抽样研究 只有对总体中的部分个体进行抽样研究,才可能导致样本指标与总体指标的不相等,而且在同一类型的研究中,样本例数越少,抽样误差可能会越大。 个体变异 在抽样方法和样本含量不变的条件下,变异大的事物其抽样误差也大,反过来,变异小的事物其抽样误差也小。 三、均数的抽样误差及标准误 如果进行K次抽样,所得的K个样本统计量(例如 )很可能各不相同。 将这些样本统计量编制成频率分布图,就可看出样本统计量的抽样分布规律。 计算机模拟: 从正态分布N(5.00,0.502)的总体中随机抽取100个样本,每个样本的样本含量为10。在每次抽样后计算其均数,这样就得到100个样本均数。 发现一 从同一总体中随机抽取样本含量(n)相等的若干个样本,通过每一个样本可以计算出一个样本均数,这些 不一定恰好等于相应的总体均数μ,各 之间也不完全相等。 这种由于抽样而造成的来自同一总体的各个样本均数与相应的总体均数μ之间的差别,就称为均数的抽样误差。 100个样本均数的频数分布图 发现二 从所得的100个样本均数的频数分布直方图可以看出, 的分布是有规律,围绕着μ,中间多,两边少,左右基本对称。 正态分布? 中心极限定理 涵义:从均数为μ、标准差为? 的总体中独立、重复、随机抽取含量为n的样本,当样本含量n增加时,样本均数 的分布将趋于正态分布,此分布的均数为μ,标准差为 。 在统计理论上将样本均数的标准差 称为标准误(standard error,SE) ,用来衡量抽样误差的大小。 越小,则抽样误差越小,表示样本均数与总体均数越接近,用样本均数估计总体均数的可靠性就越好; 反过来, 越大,则抽样误差越大,表示样本均数离总体均数就越远,用样本均数估计总体均数的可靠性就越差。 标准误和标准差呈正比,与样本含量呈反比。 例、随机抽取某市200名7岁男童的身高均数为124.0cm,标准差为4.6cm,试估计其抽样误差。 抽样误差可以通过标准误来反映,所以利用标准误的公式来求解: 中心极限定理认为:即使是从非正态分布的总体中进行随机抽样,只要样本含量足够大(一般n≥50),样本均数的分布也趋于正态分布。 计算机模拟(Page29) 四、t分布 (一)t分布的概念 如果某变量X服从总体均数为 ?、标准差为? 的正态分布,即 , , ,…服从正态分布N(?、? 2),那么,标准化变换后, , , ,…它们就服从标准正态分布N(0,1),也称u分布。 中心极限定理表明,从正态分布N(? ,? 2)中,随机抽取n次样本(当样本含量较大时),所得的一系列均数 , , ,…,也就服从正态分布N(? , ),同理,就有 , , ,…,也服从标准正态分布N(0,1),即u分布。 在实际工作中,总体标准误 往往是未知的(尤其是在小样本的研究中),而是用样本标准误 去估计的。这时,用 代替 进行的变换就不再是u变换,而变成了t变换: 所得的 , , ,…,就不再服从标准正态分布,而是服从自由度为n-1的t分布(t-distribution)。 1908年,英国统计学家W.S.Gosset在《生物统计》杂志上发表该论文时用的是笔名“Student”,故t分布又称Student t分布。 (二)t分布的图形和特征 t值是由 代替 进行变换求得,那么当 等于或近似 时,t分布就接近u分布,即标准正态分布。 什么时候 等于或近似 ? 标准正态分布是t分布的极限形式 自由度分别为1、5、∞时的t分布 t分布特征 (1) t分布为一簇单峰分布曲线,每一个自由度都对应一条曲线。 (2) t分布以0为中心,左右

您可能关注的文档

文档评论(0)

liwenhua00 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档