- 1、本文档共103页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 抽样推断 统计学 陶浪平 南京大学出版教学教材.ppt
第6章 抽样推断;想一想Thinking Challenge;抽样推断:
从样本含有的信息中提取总体的信息;参数估计在统计方法中的地位;例:某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36分钟)。;抽样推断的过程;抽样分布:
样本统计量(样本平均数或样本比率)的概率分布;第一节 抽样推断的一般问题;;随机原则的实现;;2.抽样推断的特征;二、抽样推断的应用范围;二、抽样推断的应用范围;三、抽样推断的内容;四、有关抽样的基本概念及理论依据;1.全及总体和样本;2.全及指标(总体参数)和抽样指标(统计量);设样本中 个样本单位,某项标志的标志值
分别为 ,其中具有和不具有某
种属性的样本单位数目分别为 和 个,则;②样本单位标志值的标准差:;④样本成数:;?常用的参数;重复抽样;抽样方法的分类;样本的可能数目;(二)抽样推断的理论基础;第二节 抽样误差;一、抽样误差的概念及影响因素;⒉代表性误差
是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。
它包括两类误差:系统性误差和随机性误差。;⑴系统性误差
它是由于抽样时违反随机原则而产生的误差。
系统性误差和登记误差一样,都是抽样组织工作造成的,应该采取措施预防或将其减小到最低程度。
⑵随机性误差
它是指由于随机抽样的偶然因素使样本代表性不足而引起的。
随机性误差在抽样推断中是不可避免的。
;⒊抽样误差
广义:指代表性误差
狭义:专指抽样调查中的随机性误差;(二)抽样误差的影响因素
1.总体各单位标志值的差异程度;
2.样本的单位数;
3.抽样的方法;
4.抽样调查的组织形式。
;二、抽样平均误差;1.重复抽样的条件下;2.不重复抽样的条件下; 式中, N为总体单位数; n为样本容量; 为总体成数方差一般情况下是未知,可用样本成数方差 替代 。
;由此可以看出,同样条件下,重复抽样与不重复抽样的抽样平均误差之间相差一个 ,称 为校正因子。
由于 ,因此在同样条件下,不重复抽样的平均误差总是小于重复抽样的平均误差。
在抽样比例 很小时,;3.当总体方差和标准差未知时,可用以下方法解决:
⑴用样本方差来代替总体方差
⑵可用过去全面调查的资料,也可以用过去抽样调查的资料代替
如果有多个不同的材料,则应选择用方差数值较大的。
⑶用估计资料代替;例:某企业生产一批灯泡,共10000只,随机抽取500只作耐用时间实验。测算结果平均使用寿命为5000小时,样本标准差为300小时,500只中发现10只不合格。求平均数和成数的抽样平均误差。;三、抽样极限误差;第三节 抽样推断的方法——参数估计Parameter Estimation; ;二、总体参数的点估计;(一)参数点估计的概念及特点;2.特点
⑴方法简单,能够提供总体参数的具体估计值,从而可以作为行动决策的数量依据。
⑵无法控制误差,仅适用于对推断的准确程度与可靠程度要求不高的情况。;问题:
第一,我们为什么以这一个而不是那一个统计量来估计某个总体参数? ;(二)抽样估计量的优良标准;优良估计量标准;优良估计量标准;(三)抽样估计的估计精度;(四)抽样推断的置信度; 抽样推断的置信度是表明样本指标和总体参数之间的误差不超过一定范围的概率的概率保证程度。置信度一般用“1-α”表示。
置信度与概率度的之间关系:
; 同样,置信度可以通过《正态分布概率表》(P149)获得:
由此可见,抽样极限误差和估计的置信密度不可分:极限误差范围越小,估计的置信度也越小;极限误差范围越大,估计的置信度也越大。;三、总体参数的区间估计Confidence Interval Estimates;; 置信区间估计 Confidence Interval Estimation;(一)区间估计的基本特点及要素; 被估计总体参数 在区间 和 内的概率为1-a,即:
其中 和 为置信区间。
;统计学 第6章 抽样推断 第三节 参数估计;(二)总体参数的区间估计估计方法;第四节 抽样的组织方式;一、抽样组织设计的基本原则;二、常用的抽样
文档评论(0)