- 1、本文档共128页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章; 不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑
—— Gudmund R.Iversen;;大学生每周上网花多少时间?;大学生每周上网花多少时间?;;1.1 抽样推断及其特点;1.1 抽样推断及其特点; 利用样本统计量推断总体参数;;1.3 抽样推断的基本条件 ;1.4 抽样推断的误差 ;1.4 抽样推断的误差 ;;1.4 抽样推断的误差 ;;; 极限误差标准化的意义:;;2.1 总体参数估计概述 ;;参数估计(parameter estimation)就是用样本统计量去估计总体的参数
估计量:用于估计总体参数的统计量的名称
如样本均值,样本比例,样本方差等
例如: 样本均值就是总体均值? 的一个估计量
参数用? 表示,估计量用 表示
估计值:估计参数时计算出来的统计量的具体值
如果样本均值 ?x =80,则80就是? 的估计值;优良估计量的三个标准:;2.一致性:(consistency);x;3. 有效性: (efficiency) ;;推断总体;;2.3 区间估计(interval estimate);;;将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度
表示为 (1 - ????
??为是总体参数未在区间内的比例?
常用的置信水平值有 99%, 95%, 90%
相应的 ??为0.01,0.05,0.10;由样本估计量构造出的总体参数在一定置信水平下的估计区间
统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间
如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。同样,其他置信水平的区间也可以用类似的方式进行表述;总体参数的真值是固定的,而用样本构造的区间则是不固定的,因此置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数
实际估计时往往只抽取一个样本,此时所构造的是与该样本相联系的一定置信水平(比如95%)下的置信区间。我们只能希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个;当抽取了一个具体的样本,用该样本所构造的区间是一个特定的常数区间,我们无法知道???个样本所产生的区间是否包含总体参数的真值,因为它可能是包含总体均值的区间中的一个,也可能是未包含总体均值的那一个
一个特定的区间总是“包含”或“绝对不包含”参数的真值,不存在“以多大的概率包含总体参数”的问题
置信水平只是告诉我们在多次估计得到的区间中大概有多少个区间包含了参数的真值,而不是针对所抽取的这个样本所构建的区间而言的 ;;使用一个较大的置信水平会得到一个比较宽的置信区间,而使用一个较大的样本则会得到一个较准确(较窄)的区间。直观地说,较宽的区间会有更大的可能性包含参数
但实际应用中,过宽的区间往往没有实际意义
比如,天气预报说“在一年内会下一场雨”,虽然这很有把握,但有什么意义呢?另一方面,要求过于准确(过窄)的区间同样不一定有意义,因为过窄的区间虽然看上去很准确,但把握性就会降低,除非无限制增加样本量,而现实中样本量总是有限的
区间估计总是要给结论留点儿余地 ;; 1. 区间的确定:; 2. 概率的确定:;;;Δ; 标准化的意义:; 二 总体平均数的区间估计:;2.3 区间估计; 【例 5-2】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为 4 小时。如果已知总体的标准差σ = 1.5 小时。试求该地区内居民每天看电视的平均时间的置信区间。
(置信度是 95%);2.3 区间估计;2.3 区间估计; 【例 5-3】某地区电视台委托调查公司估计该地区居民平均每日看电视时间。调查公司随机抽取了100名居民进行调查,样本数据显示平均每人每天看电视时间为 4 小时。如果已知总体的标准差σ = 1.5 小时。试求该地区内居民每天看电视的平均时间的置信区间。
(要求估计误差不超过27分钟);2.3 区间估计;;; 【例 5-4】 从某校学生中随机抽取25人,调查到他们平均每天参加体育锻炼的时间为25分钟,标准差为8分钟。试以95%的置信水平估计该校学生平均每天参加体育锻炼的时间。;2.3 区间估计;三 总体成数的区间估计
成数是一个特殊的平均数,它是交替标志的平均数。
可以应用总体平均数的估计方法来对总体成数进行估计。;抽样,计算 估计区间的中心;【例5-5】某工厂要估计一批总数5 000件的产品的废品率,于是随机抽出 400 件产品进
文档评论(0)