统计与概率知识点..docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计与概率知识点.

第二章 统计 2.1随机抽样2.1.1简单随机抽样1.简单随机抽样:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.最常用的简单随机抽样方法有两种——抽签法和随机数法.3.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.4.随机数法就是利用随机数表、随机数骰子或计算机产生的随机数进行抽样.5.简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.2.1.2系统抽样1.一般地,假设要从容量为N的总体中抽取容量为n的样本 ,我们可以按下列步骤进行系统抽样:(1)先将总体的N个个体)编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k,对编号进行分段.当(n是样本容量)是整数时,取k=.(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k).(4)按照一定的规则抽取样本.通常是将l加上k得到第2个个体编号(l+k),再加上k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.2.当总体中元素个数较少时,常采用简单随机抽样;当总体中元素个数较多时,常采用系统抽样.2.1.3分层抽样1.分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.2.当总体是由差异明显的几部分组成时,往往选用分层抽样的方法.3.分层抽样应注意的问题(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是每层内样本的差异较小,不同层之间的样本的差异要大,且互不重叠.(2)抽取比例由每层个体占总体的比例确定.(3)各层抽样可按简单随机抽样或系统抽样进行.4.三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的可能性相等从总体中逐个抽取最基本的抽样方法总体中的个体数较少系统抽样抽样过程中每个个体被抽取的可能性相等将总体均匀分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时,采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成 2.2用样本估计总体2.2.1用样本的频率分布估计总体分布1.通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.2.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式.作图可以达到两个目的:一是从数据中传递信息;二是利用图形提取信息,表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.3.在频率分布直方图中,纵轴表示频率与组距的比值,数据落在各小组内的频率用小长方形的面积表示,各小长方形的面积总和等于1.4.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.随着样本容量的增加,作图时所分的组数在增加,组距减小相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.5.当样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,给数据的随时记录和随时记录都带来了方便.1.频率分布表(1)编制频率分布表的一般步骤.①求极差.决定组数和组距,组距=;②分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;③统计频数.计算频率,列出频率分布表.(2)频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便2.频率分布直方图(1)作频率分布直方图的方法为:把横轴分出若干段,每一线段对应一组组距,然后以此线段为底作一矩形,它的高等于该组的频率/组距,这样得到了一系列的矩形,每个矩形的面积恰好是该组上的频率.这些矩形就构成了频率分布直方图.(2)频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式.但是从直方图本身得不出原始数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了.3.频率分布折线图(1)如果将频率分布直方图中相邻的矩形的上底边的中点顺次连接起来,就得到一条折线,这条折线为样本数据的频率分布折线图.如果将样本容量取得足够大,分组的组距足够小,则这条折线就趋近于一条曲线,这条曲线称为总体密度曲线.(2)频率分布折线图的优点是它反映了数据的变

文档评论(0)

vc5gv1x + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档