05参数估计基础..doc

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
05参数估计基础.

第五章 参数估计基础 [教学要求] 了解:通过电脑实验了解抽样分布及t分布的特征,了解查表法估计总体概率的置信区间。 熟悉:理解抽样误差的概念;熟悉标准误的意义及其应用。 掌握:会计算均数及频率的标准误;掌握总体均数95%和99%置信区间的计算及适用条件;掌握正态近似法计算总体概率的95%和99%置信区间及适用条件;阐述标准差与均数标准误的区别。 [重点难点] 抽样误差与标准误 一、均数(频率)的抽样分布及抽样误差 基本概念:在同一总体中反复多次随机抽取样本含量相同的若干样本,由于个体差异与偶然性的影响,样本统计量之间以及样本统计量与总体参数之间的差异,称为抽样误差。这种由抽样造成的均数之间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。 特点:从正态分布N(μ,σ2)总体中抽样,样本均数仍服从正态分布;从非正态分布总体抽样,只要样本量足够大(n ? 50),样本均数的分布也近似于正态分布。在抽样研究中,抽样误差是不可避免的。用来表示抽样误差大小的指标称为标准误。 二、标准误 (一)均数标准误 意义:均数标准误用符号表示,也称样本均数的标准差。它反映了样本均数之间、样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。 计算:可按公式 计算。在实际应用中,总体标准差? 常常未知,需要用样本标准差s来估计。此时,均数标准误的估计值为 。 由此式可见,若增加样本含量n可以减小样本均数的抽样误差。 主要应用:①估计总体均数的置信区间;②均数的假设检验。 在指标的意义、计算及结果解释方面注意与标准差区别,不能将两者混淆。 频率的标准误 意义:频率的标准误用符号?p表示,它反映了样本频率与样本频率之间、样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。 计算:可按公式 ?p = 计算。在实际应用中,总体概率? 常常未知,需要用样本频率p作为总体概率 ? 的估计值 ,因此频率的标准误的估计值为 。由此式可见,增加样本含量n可以减小样本频率的抽样误差。 主要应用:①估计总体概率的置信区间;②频率指标的假设检验。 t分布 t分布的概念 服从自由度? = n ? 1的t分布。 t分布是总体均数的区间估计及假设检验的理论基础。 t分布的图形与曲线下面积分布规律 t 分布与标准正态分布相比,其分布密度有如下特征:①单峰分布,以0为中心,左右对称;②自由度? 越小,则越大,t值越分散,曲线的峰部越矮,尾部越高;③自由度? 逐渐增大时,t分布逐渐逼近标准正态分布;当? 趋于? 时,t分布就完全成为标准正态分布。 按t分布的规律,密度曲线下面积分布规律为: 单侧:P(t ? ?t?, ?)=? 或P(t ? t?, ?)=? 双侧:P(t ? ?t?/2, ?)+P(t ? t?/2, ?)=? 总体均数及总体概率的估计 参数估计的概念 参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计和区间估计两种。 点估计 直接用随机样本的样本均数作为总体均数? 的估计值或用样本频率p作为总体概率? 的估计值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。 区间估计 用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间(confidence interval , CI),这一估计可相信的程度称为置信度或置信水平(如95%或99%)。若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。 二、置信区间的计算 正态分布总体均数的置信区间 总体均数置信区间的基本公式是? t?/2, ? 。样本量较大时,可以是? Z?/2或?Z?/2(若总体标准差已知)。 实际工作中,估计总体均数置信区间时,要注意与参考值范围区别,见《卫生统计学》教材表5-4中内容。 二项分布总体概率的置信区间 根据样本含量n和样本频率p的大小,可以采用查表法和正态近似法。重点掌握正态近似法。 正态近似法:当n足够大,且样本频率p和(1?p)均不太小时,如np与n(1?p) 均大于5,p的抽样分布接近正态分布,此时总体概率的置信区间为 (p ?Z?/2Sp ,p + Z?/2Sp ),缩写为p ? Z?/2Sp 。 [案例讨论参考答案] (1)根据专业知识和《卫生统计学》第五章表5.3中的200名正常成年人血铅值的频数分布可知该资料属于正偏峰分布。用正态分布法+1.64S估计正常成年人血铅值的95%参考值范围不合适

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档