- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
抽样统计的基本概念-111
二、 抽样统计的基本概念 1. 个体、观测与总体 (1)个体(Elementary unit): 某个被测量的对象(如:一个灯泡) (2)抽样框(Frame): 全部个体的名单(list) (3)观测(Observation): 某个个体在测量变量上的取值 (如:一个灯泡的寿命) (4)总体(Population): 所有观测的集合 例如:两条正态分布的密度曲线 左边是N(-2,0.5)分布,右边是N(0, 1)分布 3. 样本与样本容量 可以从抽样框中抽取一部分个体进行观测统计,再根据这部分个体的观测信息推断总体的性质。 (1)一个样本(Sample ): 注意: 由于Xi是从总体中随机抽取的,所以 X1, X2 , …, Xn 是 n 个随机变量。 (2)样本容量(Sample Size) :n 大样本:n ? 30 小样本:n 30 (3)样本值:一次实际抽取( x1, x2 , …, xn) 三、中心极限定理 The Central Limit Theorem 在服从任意分布的总体中,抽取容量为n的样本。,如果 则样本均值 和样本比例 都近似服从正态分布. 根据Chebyshev 定理 可以推导出: 在以下区间内,所包含的统计值的比例大于95% (?- 2?, ?+2 ?) (一)基本概念 1.总体参数 ? 2.样本 3.样本容量 n 4.样本值: 5. 估计值 6.抽样误差: 问题:如何测量抽样误差? 1. 区间估计的概念 Interval Estimation 在总体 X 抽取一个容量为 n 的随机样本 X: ? x1, x2, …, xn 利用样本构造两个统计量 使得: 置信区间 Confidence Interval : 置信度 Level of Confidence : 1-? 在大样本的前提下:总体均值的95%的置信区间的半长大约是: 均值的置信区间的宽度取决于三个因素: 1. 置信度 (95% ; 99.7%) 2. 标准差: 3. 样本容量: n (是可控制的) 总体均值的99.7%的置信区间的半长大约是: 原则:调查者不能根据主观意图挑选调查单位。而是在总体中,按照随机原则和纯粹偶然性的方法抽取样本。 8.5 简单随机抽样方法 简单随机抽样: 每一个容量为 n 的可能样本被抽到的概率都是一样的。 方法: (1)抽签法 (2)乱数表法(随机数字表) 抽签法: 先将调查总体的每个单位编上号码,然后将号码写在卡片上搅拌均匀,任意从中选取。抽到一个号码,就对上一个单位,直到抽足预先规定的样本数目为止。 (1) 总体均值的估计(大样本) 放回抽样 总体均值的点估计 95%的置信区间估计(抽样误差) 抽样误差: 不放回抽样 总体均值的点估计 同样样本容量下,不放回抽样的误差更小! N—总体中的个体数量 n —样本容量 95%的置信区间 (2) 总体比例的估计 (大样本) 放回抽样 不放回抽样 _(_______._______)_ (3) 样本容量的确定 估计总体均值时需要的样本容量 在构造总体均值的置信度为 95%的置信区间 置信区间的半长 D 等于 放回抽样 如何确定调查所需要的精度 D 应用时,由于存在量纲问题,可以采用相对误差: 所以常用的方法是: 不放回抽样 置信区间: 抽样误差范围: 要求样本容量为: 估计总体比率时需要的样本容量 置信度为 95%,总体比率 p 的置信区间为 95%的置信区间的宽度为 样本容量为 问题:在调查之前 是未知的 放回抽样 解决的办法: 1 0.1 0.2 0.3 0.4 0.5 0.6 …... 0 0.9 0.8 0.7 0.6 0.5 0.4 …... = 0.5 = 0.5 所以样本容量 n 的最大值是: 取 例题: 北京地区观众调查网的置信度要求95%,误差要求不超过3%。求所需要的样本容量。 解: D=0.03 不放回抽样
文档评论(0)