- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 抽样与抽样估计
本章的主要目的:
掌握抽样与抽样估计的基本含义;
掌握估计总体均值、比例与方差的方法。
掌握如何确定样本容量方法。
5.1 抽样调查中的基本概念
统计研究的目的是分析说明某一现象总体的数量特征。通过抽样得到一个样本,根据抽样分布的原理、利用样本资料对总体特征进行科学的估计与推断就是抽样估计。
1. 总体与样本
总体是根据研究目的确定的所要研究的同类事物的全体,是所要说明其数量特征的研究对象。构成总体的个别事物就是总体单位。总体单位的总数就是总体容量N。在抽样估计中,用来反映总体数量特征的指标称之为总体指标,也叫总体参数。
从总体中抽取的部分总体单位所构成的整体就是一个总体的一个样本。样本所包含的总体单位个数称之为样本容量n。
大样本与小样本。n≥30与n<30。
抽取样本的目的就是要用样本特征去估计总体特征。如何由于代表性误差的存在,关键在于如何科学地从总体中抽取样本、如何估计和控制代表性误差、怎样利用样本的特征去估计和推断总体的特征?
样本指标就是样本统计量,即估计量,是根据样本资料计算的、用以估计和推断相应总体指标的综合指标,它是随样本不同而不同的随机变量,抽取不同的样本就得到不同的估计量。
2. 概率抽样与非概率抽样
随机抽样能有效避免主观选样带来的倾向性误差(系统偏差),使得样本资料能够用于估计和推断总体的数量特征,而且使这种估计和推断得以建立在概率论和数理统计的科学理论之上,可以计算和控制抽样误差,能够说明估计结果的可靠程度。
3. 抽样框
目标总体,也就是理论上的抽样范围,常与实际抽样范围不一致。抽样单位可以是各总体单位,也可以是总体单位的集合。实际抽样的总体范围和抽样单位确定后我们才可以进行抽样。
抽样框是包括全部抽样单位的名单框架,它会直接影响到抽样调查的随机性和调查的效果。抽样框有三种主要形式:
名单抽样框。列出全部总体单位的名单一览表。
区域抽样框。按地理位置将总体范围划分为若干区域,以小区域为抽样单位。
时间表抽样框。将全部总体单位按时间顺序进行排列,把总体的时间过程分为若干个小的时间单位,以此时间单位为抽样单位。
一个理想的抽样框应该与目标总体一致,即应包括全部总体单位,既不重复也不遗漏。相关辅助变量信息的应用。
思考:电话号码与城市居民!
4. 抽样误差
登记性误差是在调查和汇总过程中由于观察、测量、登记、计算等方面的差错或被调查者提供虚假资料而千万的误差。任何调查都可能产生。
代表性误差是指用样本指标推断总体指标时,由于样本结构与总体结构不一致、样本不能完全代表总体而生产的误差,有系统误差与随机误差两种。
系统误差是指由于非随机因素引起的样本代表性不足而产生的误差,偏差。随机误差指遵循随机抽样原则,由于随机因素引起的代表性误差。
登记性误差和系统误差都可以尽量避免,而随机误差则是不可避免的。
实际抽样误差。样本估计值与总体参数的离差有一定的分布规律,所谓抽样误差可以控制和计算并不是指某次具体抽样的实际误差,而是指从所有可能样本来考察的抽样平均误差和抽样极限误差。
抽样平均误差。即样本估计量的标准差,也就是所有可能样本的估计值与总体参数的平均差异程度,反映了所有可能样本的实际抽样误差的一般水平。抽样方差。
抽样极限误差。指一定概率下抽样误差的可能范围,允许误差。抽样极限误差是抽样误差的可能范围而不是完全肯定范围,这个可能范围大小与估计这大小的概率紧密相关,这个概率就是置信度。在其他条件不变的情况下,抽样极限误差越大,相应的置信度也越大。抽样误差率与抽样估计精度。仔细看书!
5. 抽样分布
样本统计量是一种随机变量,它有若干可能取值(即可能样本指标数值),每个可能取值都有一定的可能性(概率),从而形成概率分布,即抽样分布(样本统计量的概率分布)。
精确分布和渐近分布。当总体的分布类型已知,如果对任一自然数n都能导出统计量的分布的明显表达式,即精确方法,对小样本的统计推断问题特别有用。当n≥30,人们可以借用中心极限定理用极限分布当作抽样分布的近似,即大样本方法,渐近分布。正态分布最常用。
5.2 估计总体均值:大样本
这一节的主要目标是已知一个样本数据多于30个,讨论总体均值μ的估计值。
表5-1 人体体温的均值真的是98.6℉吗?
98.6 98.6 98.0 98.0 99.0 98.4 98.4 98.4 98.4 98.6 98.6 98.8 98.6 97.0 97.0 98.8 97.6 97.7 98.8 98.0 98.0 98.3 98.5 97.3 98.7 97.4 98.9 98.6 99.5 97.5 97.3 97.6 98.2 99.6 98.7 99.4 98.2 98.0 98.6 98.6 97.2 98.4 98.6 98.2
文档评论(0)