- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、总体参数估计概述 设待估计的总体参数是θ,用以估计该参数的统计量是 , 抽样估计的极限误差是Δ,即: 极限误差是根据研究对象的变异程度和分析任务的性质来确定的在一定概率下的允许误差范围。 二、总体参数的点估计 点估计的含义:直接以样本统计量作为相应总体参数的估计量。 优良估计量标准 优良估计标准: 无偏性:要求样本统计量的平均数等于被估计的总体参数本身。 一致性:当样本容量充分大时,样本统计量充分靠近总体参数本身。 有效性: 三、参数区间估计 参数区间估计的含义:估计总体参数的区间范围,并给出区间估计成立的概率值。 其中: 1-α(0α1)称为置信度;α是区间估计的显著性水平,其取值大小由实际问题确定,经常取1%、5%和10%。 区间估计的基本要素 包括:样本点估计值、抽样极限误差、估计的可靠程度 样本点估计值 抽样极限误差:可允许的误差范围。 抽样估计的可靠程度(置信度、概率保证程度)及概率度 注意:本章所进行的区间估计仅指对总体平均数或成数的区间估计,并且在际计算过程中使用下面的式子。式中Δ是极限误差。 平均数的区间估计 对总体平均数或成数的区间估计时,使用下面的式子 (式中Δ是极限误差) 有两种模式: 1、根据置信度1-α,求出极限误差Δ,并指出总体平均数的估计区间。 2、给定极限误差,求置信度。 成数的区间估计 由于总体的分布是(0,1)分布,只有在大样本的情况下,才服从正态分布。总体成数可以看成是一种特殊的平均数,类似于总体平均数的区间估计,总体成数的区间估计的上下限是: 大样本的条件:np≥5且n(1-p) ≥5,由于总体成数p通常未知,可以用样本成数来近似判断。 对总量指标的区间估计 在对总体平均数进行区间估计的基础上,可进一步推断相应的总量指标,即用总体单位总数N分别乘以总体平均数的区间下限和区间上限,便得到相应总量的区间范围。 三、样本容量确定 什么是样本容量确定问题? 确定样本容量 在设计抽样时,先确定允许的误差范围和必要的概率保证程度,然后根据历史资料或试点资料确定总体的标准差,最后来确定样本容量。 确定样本容量应注意的问题 1、计算样本容量时,一般总体的方差与成数都是未知的,可用有关资料替代: 一是用历史资料已有的方差与成数代替; 二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差; 三是成数方差在完全缺乏资料的情况下,就用成数方差的最大值0.25代替。 例:确定样本容量1 对某批木材进行检验,根据以往经验,木材长度的标准差为0.4米,而合格率为90%。现采用重复抽样方式,要求在95.45%的概率保证程度下,木材平均长度的极限误差不超过0.08米,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少? 例:确定样本容量2 对某批木材进行检验,根据以往经验,木材的合格率为90%、92%、95%。现采用重复抽样方式,要求在95.45%的概率保证程度下,抽样合格率的极限误差不超过5%,问必要的样本单位数应该是多少? * 第一节 总体参数估计 参数估计的两个要求: (1)精度:估计误差的最大范围,通过极限误差Δ来反映。显然,Δ越小,估计的精度要求越高,Δ越大,估计的精度要求越低。极限误差的确定要以实际需要为基本标准。 (2)可靠性:估计正确性的一个概率保证,通常称为估计的置信度。 总体方差的无偏估计量为样本方差 点估计完全正确的概率通常为0。因此,我们更多的是考虑用样本统计量去估计总体参数的范围 ? 区间估计。 样本统计量 (点估计) 置信区间 置信下限 置信上限 置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n),每一组样本值确定一个区间 ,每个这样的区间要么包含 的真值,要么不包含 的真值。在这么多的区间中,包含真值 的约占 ,不包含真值的约仅占 。 假如:我们用95%的置信度得到某班学生考试成绩的置信区间为60-80分,如何理解? 如果做了多次抽样(如100次),大概有95次找到的区间包含真值,有5次找到的区间不包括真值。 真值只有一个,一个特定的区间“总是包含”或“绝对不包含”该真值。但是,用概率可以知道在多次抽样得到的区间中大概有多少个区间包含了参数的真值。 置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为 的置信区间 ,一方面置信水平 越大,估计的可靠性越高;另一方面区间 的长度越小,估计的精确性越好。但这两方面通常
文档评论(0)