第六章参数估计基础幻灯片.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 参数估计基础 预防医学教研室 徐 谦 Tel: 主要内容 抽样分布与抽样误差 t分布 总体均数和总体概率的估计 统计推断: (statistical inference) 通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程,即为统计推断。 常用的统计推断方法 参数估计(estimation of parameters) 假设检验(test of hypothesis) 第一节 抽样分布与抽样误差 1、抽样试验 A、抽样试验(n=5) B、抽样试验(n=10) C、抽样试验(n=30) 1000份样本抽样计算结果 3个抽样实验结果图示 抽样误差:(sampling error) 由个体变异产生的,抽样造成的样本统计量与总体参数的差异,即为抽样误差。 样本均数作为随机变量: 各样本均数未必等于总体均数; 样本均数之间存在差异; 样本均数的分布很有规律,围绕着总体均数(155.4cm),中间多,两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小。 随着样本量的增大,样本均数的变异范围逐渐减少。 样本均数的抽样误差 定义: 由抽样造成的样本均数与样本均数间、样本均数与总体均数间的差异称为均数的抽样误差。用样本均数的标准差来表示,通常称为样本均数的(standard error of mean, SE或SEM)。 公式的含义 故均数标准误与标准差成正比,与样本例数n的平方根成反比,若标准差不变,则可通过增大n来减小均数标准误,从而降低抽样误差。 抽样实验小结: 均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error) =样本标准差/ 从正态总体 中抽取样本,获得均数的分布仍近似呈正态分布 。 例如 在一口袋装有形状、重量完全相同的黑球和白球,已知黑球比例为20%(总体概率=20%)。从口袋中每摸一次看清颜色后放回去,搅匀后再摸,在重复摸球35次(n=35),计算摸得黑球的百分比?(样本频率)重复这样的实验100次(100份样本),每次得到的黑球的比例分别为14.4%, 19.8%, 20.2%,22.5%等。 摸到黑球的频率的特点: 样本频率围绕总体频率(20%)分布; 多数样本频率离20%较近,少数频率离20%较远。 样本频率的抽样误差 样本频率与样本频率之间、样本频率与总体频率之间的差异称为频率的抽样误差。 公式的含义 此式说明: 1、样本频率的标准误与样本含量n的平方根成反比。 2、增加样本含量n,可减小样本频率的抽样误差。 第二节 t分布 (t distribution) 一、t分布的概念 实际应用中, 未知,用 二、t 分布的图形和特征 从前述的13岁女学生身高这个正态总体中分别作样本量为3和50的随机分布,各抽取1000份样本,并分别得到1000个样本均数及其标准误。对它们分别作t变换,并将t值绘制相应的直方图。 如图5-2,可见样本量为3的图较样本量为50的图显得矮胖,两侧尾部较粗。 t分布图形的特征 t分布是一簇曲线。其形状随?的不同而不同。 1、单峰分布,以0为中心,左右对称; 2、 ?越小,则 越大,t值越分散,其分布的峰部越矮,而尾部翘得越高; 3、随着?逐渐增大,t分布逐渐接近标准正态分布;当? 逼近?,t分布逼近u分布,故标准正态分布是t分布的特例。 t分布曲线下面积(附表2,P434) 1、t 值表 横:概率 p, 即曲线下阴影部分的面积; 纵:自由度, υ 表中的数字:相应的 |t | 界值。 2、表示方法 3、特点: (1) 当自由度一定时,| t | 值越大, 尾部P 越小。 ( 2)在相同 t 值时双尾概率P为单尾 概率P 的两倍。 第三节 总体均数及总体概率的估计 一、参数估计的概念 参数估计:指用样本指标(统计量)估计总体指标(参数)。 二、参数估计的种类 1、点值估计 用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数的点估计值,用样本频率作为总体频率的点估计值。 缺点:未考虑抽样误差的大小,无法评价估计值和真值之间的差距。 2、区间估计 结合样本统计量和标准误,按预先给定的概率(1—?)确定的包含未知总体参数的可能范围,称参数的置信区间(confidence interval, CI)。 常取95%或99%。若无特别说明,一般取双侧95%。 换言之: 置信区间就是用样本指标来估计总体参数的大概

文档评论(0)

cumhuatgw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档