04__参数估计基础2013..ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
04__参数估计基础2013.剖析

* * 案例讨论 案例5-1 不合适。 错误1:资料呈正偏峰分布,尽管样本来自非正态总体,但因样本含量较大,样本均数的分布近似于正态分布,可用正态近似法估计置信区间,不必进行对数转换。 错误2:因血铅值过高为异常,因而求其单侧95%置信区间的上限。 * * 什么是参数估计? 某课题组在研究北京市儿童1型糖尿病的发病规律,需要了解该市健康儿童的血糖水平(总体均数),如果由你来完成任务,你将如何获得这个参数呢? 普查该市125万名儿童的血糖值,可行吗? * * 某研究团队在研究骨折与骨质疏松关系时,需要确定老年人骨折的频率(总体概率),如果由你来完成任务,你将如何获得这个参数呢? 调查全体老年人,可行吗? * * 解决方案 问题一:实际工作中,一般是通过检测北京市所有健康儿童这一总体中的一个随机样本,用样本均数来估计北京市健康儿童血糖水平的总体均数。 问题二:对老年人的一个随机样本进行一定时期的随访来确定该样本中骨折的频率,用样本率p估计总体率π。 因此,统计学中通过抽样来估计总体参数,称为参数估计(estimation of parameter)。 * * 标准误的用途: 1、反映样本均数变异程度的指标,常用来表示抽样误差的大小。 标准误越大,反映样本均数抽样误差大,其对样本均数对总体均数的代表性差,可靠性差; 标准误小,样本均数抽样误差小,其对总体均数的代表性好; 2、与样本均数结合,用于总体均数的可信区间估计; 3、假设检验。 * * t分布尾部面积的特点 ①自由度相同时,│t│值越大,尾部概率P越小; ② ?一定, t值相同时,双侧尾部概率是单侧尾部概率的2倍;t0.10/2,16 = t0.05,16 =1.746; * * t分布与标准正态分布相比有以下特征: 1、两者都是单峰分布,以0为中心,左右对称。 2、t分布的峰部较矮而尾部翘得较高,随着自由度的增加,t分布逐渐逼近正态分布,当?=?时,t分布就完全等于标准正态分布。 3、标准正态分布有两个固定常数(0,1),t分布只有一个参数? 。 * * 练习: 1、ν=10,双侧尾部面积为0.05的t界值是? 2、ν=100,单侧尾部面积为0.05的t界值是? 3、ν=∞,双测尾部面积和单侧尾部面积分别为0.05的界值是? * * 1、t 0.05/2,10=2.228 2、t 0.05,100=1.660 3、t 0.05/2, ∞ =1.96, t 0.05, ∞=1.645 * * 第三节 总体均数及总体概率的估计 统计推断 参数估计 (样本统计量推断总体参数 ) 假设检验 一、参数估计 常用的估计方式有两种: 1、 点估计(point estimation) 2、 区间估计(interval estimation) * * 点估计(point estimation) 点估计:直接利用样本统计量的一个数值来估计总体参数。(如s估计 ) 例:在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,(假设总体均数为4.75×1012/L ) 标准差0.38 ×1012/L , 试估计该地成年男子红细胞的总体均数? 答:该地成年男子红细胞的总体均数为4.77×1012/L 。 优点:思维朴素、方法简单; 缺点:没有考虑抽样误差,难以反映参数的估计值对其真值的代表性(即两者之间差距),无法评价参数估计的准确程度。 特点:估计的精度高但可信度低 * * (二)区间估计(interval estimation) 区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,这种估计方法叫做区间估计。 置信度:预先给定的概率(1??)称为可信度或置信度(confidence level),常取95%或99%。 记为100(1??)%或(1??), ?值由研究者预先规定,一般取0.1,0.05,0.01,常取0.05; 置信区间(confidence interval,CI):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的可信区间或置信区间; (上限,下限)——开区间 * * 实际工作中,如无特殊说明,一般作双侧置信区间的估计。 必要时,也可进行单侧区间估计。 在报告参数估计的结果时,应同时给出点估计值和置信区间。 * * 例 试计算例中该地成年男子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档