- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样与参数估计;统计方法;第3页/共93页; 一、参数估计的概念
统计抽样法是统计分析研究中的一种重要方法,包括统计调查和参数估计两部分。;; 参数估计的特点
抽取样本单位时,遵循随机原则;
是由部分推断总体的一种研究方法,即以样本的数量特征去推断总体的数量特征;
抽样推断产生抽样误差,但抽样误差可以事先计算与控制。
;有关参数估计的几组概念(回顾);总体:又称母体、全及总体,指所需要研究对象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用N表示;
样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选单位构成。样本单位数用n表示;
总体是唯一的、确定的,而样本是不确定的、可变的、随机的。
;总体参数:反映总体数量特征的指标,数值是唯一确定的。
样本统计量:根据样本分布计算的指标,是随机变量。;
平均数
标准差
比 例;代表样本单位数量标志的一般水平;
通常用 表示:
;在抽样总体中,一个现象有两种表现时,其中具有某一种表现的单位数占抽样总体单位数的比重叫做样本成数,用p表示。
计算公式为:
式中,n代表样本总体单位数,n1表示具有某一种表现的单位数;n0代表不具有此种表现的单位数;p、q代表样本成数。;例如,从某灯泡厂生产的灯泡中,抽样检查了100只灯泡,其中有3只不合格,则:
样本灯泡不合格率
样本灯泡合格率;重复抽样(有放回的抽样)
例:从ABCDE五个字母中随机抽取两个作为样本,N=5,n=2
考虑顺序时:样本个数=5*5=25
不考虑顺序时,样本个数=15;不重复抽样(无放回抽样)
例如从ABCDE五个字母中随机抽取两个作为样本,N=5,n=2
考虑顺序时:样本个数=20
不考虑顺序时:样本个数=10;基本原则:
保证实现抽样的随机性原则
保证实现最大的抽样效果原则;简单随机抽样
在对总体未做任何处理的情况下,按随机原则直接从总体的N个单位中抽取n个单位作为样本,使每个总体单位都有同等机会被抽到。
具体方法:
先对总体每个单位进行编号,然后采用抽签的方式或根据《随机数表》来抽取样本。;
直接从总体中??取所需要调查的单位,无须经过分组、分类、排队或组群等处理;
必须事先对总体中所有单位进行编码或编号。当总体很大,编号工作很困难,或对连续生产的产品不可能编号时,就很难采用这种方法;
抽取样本时不借助有关标志的辅助信息;
当总体各单位标志值之间差异很大时,采用这种抽样方式不能保证样本的代表性;
简单随机抽样主要适用于单位数不多且内部差异不太大的总体的抽样。;
又称为分类抽样,是先对总体各单位按照某一标志加以分类,再从各类中按随机原则抽取样本单位。
优点:
能提高样本的代表性;
能降低抽样平均误差的总方差;
便于组织工作;
适用于对被调查标志的标志值在各单位间分布差异大的总体的抽样。;
方法:等比例分配法
即样本单位在各类之间的分配比例与总体单位在各类之间的分配比例是一致的。
; 整群抽样
将总体划分为由总体单位所组成的若干群,然后以群作为抽样单位,从总体中抽取若干群作为样本,并对中选群内的所有单位进行全面调查的抽样方式。
优点:
无须编制总体单位名单,只需编制总体群名单;
当总体缺乏包括全体单位的抽样框,无法进行抽选时,可以采用整群抽样;
一般是不重复抽样;
;第22页/共93页; 等距抽样
又称为机械抽样或系统抽样,先将总体各单位按某一标志排队,然后依固定顺序和间隔来抽取样本单位的一种抽样组织形式。
等距抽样是不重复抽样,等距抽样的随机性体现在抽取第一个样本单位,当第一个样本单位确定后,其余的各个单位也就确定。
适用于对单位不多且能进行排序的总体抽样;第24页/共93页; 多阶段抽样
在总体容量很大或分布很广的情况下,很难通过一次抽样得到一个完整的样本,需要把整个抽样的程序分成若干个阶段,分阶段的进行抽样;
在抽样中能把多种抽样方式结合起来使用,最大限度的保证样本的代表性。;;第27页/共93页;在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的相对频数分布或概率分布
是一种理论分布
随机变量是 样本统计量
样本均值, 样本比例,样本方差等
结果来自容量相同的所有可能样本;;样本平均数的分布--重复抽样;;;第33页/共93页; 验证了以下两个结论
即:对于重复抽样分布,样本平均数的期望值等于总体平均数,而样本平均数的方差等于总体方差除以样本容量。; 当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值 也服从正态分布,的数学期望为μ,方差为σ2/n。即 ~N(μ,σ2/n);抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用 表示
文档评论(0)