第五章参数估计基础7版1.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章参数估计基础7版1.ppt

第五章 参数估计基础;学 习 要 点;第一节 抽样分布与抽样误差;第一节 抽样分布与抽样误差;第一节 抽样分布与抽样误差;抽样实验:假定从13岁女学生身高总体均数 , 总体标准差 的正态总体中进行随机抽样。;抽样实验:假定从13岁女学生身高总体均数 , 总体标准差 的正态总体中进行随机抽样。;样本均数的分布特点: 1.各样本均数未必等于总体均数; 2.样本均数之间存在差异; 3.样本均数的分布很有规律,围绕着总体均数,中间多,两边少,左右基本对称,也服从正态分布。 4.样本均数的变异较之原变量的变异大大缩小。;;第一节 抽样分布与抽样误差;; 1)从正态总体N(μ,σ2)中,随机抽取例数为n的多个样本,样本均数 服从正态分布;即使是从偏态总体中随机抽样,当n足够大时(如n>50), 也近似正态分布。; 身高组段 频数 组中值 fx fx2;; 例5-1 2000年某研究所随机调查某地健康成年男子27人,得到血红蛋白的均数为125g/L,标准差为15g/L 。试估计该样本均数的抽样误差。;二 、样本频率的抽样分布与抽样误差 ;π :总体率,n:样本例数。 当π未知时,p π(当样本含量足够大,且p和1-p不太小) 公式为: :率的标准误的估计值,p:样本率。; 例5-2 某市随机调查了50岁以上的中老年妇女776人,其中患有骨质疏松症者322人,患病率为41.5%,试计算该样本频率的抽样误差。; 一、t分布的概念 在统计应用中,可以把任何一个均数为μ,标准差为σ的正态分布N(μ,σ2)转变为μ=0,σ=1的标准正态分布,即将正态变量值X用 来代替。;第二节 t 分布;t分布曲线特点: 1) t分布曲线是单峰分布,它以0为中心,左右对称。 2)t分布的形状与样本例数n有关。自由度越小,则 越大,t 值越分散,曲线的峰部越矮,尾部翘的越高。 3) 当 n→∞时,则S逼近σ,t分布逼近标准 正态分布。 t分布不是一条曲线,而是一簇曲线。;;与单侧概率相对应的t值用 表示,与双侧概率相对应的t值用 表示。; 一???参数估计的概念 统计推断包括参数估计和假设检验。参数估计就是用样本指标(统计量)来估计总体指标(参数)。; ,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。;2. 区间估计:按预先给定的概率(1-α)估计总体参数的可能范围,该范围就称为总体参数的1-α置信区间(confidence interval CI)。 预先给定的概率(1-α)称为置信度,常取95%或99%。如无特别说明,一般取双侧95%。;通式: (双侧);通式: (双侧);例5-4 某市2000年随机测量了90名19岁健康男大学生的身高,其均数为172.2cm,标准差为4.5cm,,试估计该地19岁健康男大学生的身高的95%置信区间。;(3)σ未知且样本例数n较小时,按t分布原理,此时 某自由度的t曲线下有95%的t值约在±t0.05(ν)之间,;例5-3 已知某地27例健康成年男性血红蛋白量的均数为 ,标准差S=15g/L ,试问该地健康成年男性血红蛋白量的95%和99%置信区间。 本例n=27,S=15; 置信区间的两个要素 准确度:反映置信度1-α的大小,即区间包含总体均数的概率大小。 精度:反映区间的长度。 在置信度确定的情况下,增加样本例数,会减小 tа,ν 和 ,可减少区间长度,提高精度。;意义: 95%的参考值范围是指同质总体内包括95%个体值的估计范围。若总体为正态分布,常按 计算。 95%的可信区间是指按95%的置信度估计的总体参数的所在范围。若为大样本,按 计算。 计算上: 置信区间用标准误,参考值范围用标准差。; 标准差与标准误的区别

文档评论(0)

danli208 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档