1010 抽样方法 总体分布的估计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1010 抽样方法 总体分布的估计

10.10 抽样方法 总体分布的估计 一、明确复习目标   1.会用随机抽样、系统抽样、分层抽样等常用的抽样方法从总体中抽取样本 2.会用样本频率分布去估计总体分布 3.了解正态分布的意义及主要性质 4.了解线性回归的方法和简单应用 二.建构知识网络 1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样. ⑴简单随机抽样的特点:逐个抽取,不放回抽样,各个个体被抽到的概率相等.简单随机抽样方法是其他更复杂抽样方法的基础. (2)简单随机抽样的两种方法: ①抽签法:编号写签,搅拌均匀,逐个抽取.先后抽取概率均等. 抽签法简便易行,适用于个体数不太多总体.   ②随机数表法:“三步曲”:第一步,将总体中的个体编号;第二步,选定开始的数字;第三步,获取样本号码 2.系统抽样:当总体中的个体数较多时,可将总体分成均衡的几个部分,然后按预先定出的规则,从每一部分抽取一个个体,得到需要的样本,这种抽样叫做系统抽样. 系统抽样的步骤:(总体中的个体的个数为N,样本容量为n) ①采用随机的方式将总体中的个体编号.为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等 ②确定分段(部分)的间隔k当是整数时,k=;当不是整数时,先从总体中用简单随机抽样剔除一些个体,使剩下的总体中个体数能被n整除,取k=. ③在第一段用简单随机抽样确定起始的个体编号. ④按照事先确定的规则抽取样本(通常是将加上间隔k,得到第2个编号+k,第3个编号+2k,……) 与简单随机抽样一样,系统抽样是等概率抽样,它是客观的、公平的. 可以证明:当n不能整除N时,先刎除的个体与其它个体一样,被抽的概率也是1/N. 3.分层抽样: 当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,所分成的部分叫做层. 简单随机抽样,系统抽样,分层抽样都是等概率抽样,简单随机抽样是基础,系统抽样的第一部分和分层抽样的每一层都采用简单随机抽样. 随机抽样、系统抽样、分层抽样都是不放回抽样 4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示. 5.总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布. 总体分布是不易知道的,通常用“样本频率分布估计总体分布”,这是统计的基本思想方法,样本容量越大,估计越精确. 总体密度曲线baxOy6.总体密度曲线:如果 总体密度曲线 b a x O y 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。   总体分布密度密度曲线函数y=f(x)的两条基本性质:   ①f(x) ≥0(x∈R);②由曲线y=f(x)与x轴围成面积为1。 7.正态分布: 象测量的误差、产品的尺寸等总体分布密度曲线可用 ,(σ>0,-∞<x<∞) 近似表示,这样的分布中正态分布, 记为,f(x)叫正态分布密度函数.其中π是圆周率;e是自然对数的底;x是随机变量的取值;μ为正态分布的均值;σ是正态分布的标准差. (1)正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D。 (2)正态曲线具有以下性质: ①在x轴的上方,与x轴不相交。 ②关于直线x =μ对称。 ③在x =μ时位于最高点。 ④当x μ时,曲线上升;当x μ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。 ⑤当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。 8.标准正态曲线:当μ=0、σ=l时,叫标准正态总体, 分布密度函数:,(-∞<x<+∞),相应的曲线叫标准正态曲线. 标准正态总体N(0,1)中,总体取值小于的概率,P(xx0)=Φ(x0),当x00时, 可由标准正态分布表查得.当时,; Φ(0)=0.5.. 任何正态分布的概率问题均可通过转化成标准正态总体. 9.假设检验的思想:小概率事件不能发生——假设某种指标服从正态分布N(μ,σ2);(2)确定一次试验中的取值a;(2)作出统计推断:若a∈(μ-3σ,μ+3σ),则接受假

文档评论(0)

rachel + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档