- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计(文)(学生版)
统 计
【知识要点】
1.简单随机抽样
(1)定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样.
(2)最常用的简单随机抽样的方法:抽签法和随机数法.
2.分层抽样
(1)定义:将总体按其属性特征分成若干类型,然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样.
(2)分层抽样的应用范围:
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
3.系统抽样的步骤
假设要从容量为N的总体中抽取容量为n的样本.
(1)先将总体的N个个体编号;
(2)确定分段间隔k,对编号进行分段,当(n是样本容量)是整数时,取k=;
(3)在第1段用简单随机抽样确定第一个个体编号l (l≤k);
(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.
4.统计图表
统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.
5.数据的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
平均数:样本数据的算术平均数,即=(x1+x2+…+xn).
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
标准差s= ,
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
6.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便
方法与技巧
三种抽样方法的比较
类别 各自特点 相互联系 适用范围 共同点 简单随
机抽样 从总体中逐个抽取 最基本的抽样方法 总体中的个
体数较少 抽样过程中每个个体被抽到的可能性相等 系统
抽样 将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 在起始部分抽样时,采用简单随机抽样 总体中的
个体数较多 分层
抽样 将总体分成几层,按各层个体数之比抽取 各层抽样时采用简单随机抽样或系统抽样 总体由差异明
显的几部分组成 失误与防范
进行分层抽样时应注意几点:
(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是层内样本的差异要小,两层之间的样本差异要大,且互不重叠;
(2)为了保证每个个体等可能入样,所有层中每个个体被抽到的可能性相同;
(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样.
【例题解析】
题型一 简单随机抽样
【例】 假设要考察某公司生产的500克袋装牛奶的三聚青氨是否超标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个的样本个体的编号是 (下面摘取了随机数表第7行至第9行)
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
【变式训练】有一批瓶装“山泉”牌矿泉水,编号为1,2,3,…,112,为调查该批矿泉水的质量问题,打算抽取10瓶入样,问此样本若采用简单随机抽样方法将如何获得?
题型二 系统抽样
【例】 201年湖北省市为了创建国家级文明卫生城市,采用系统抽样方法从960
文档评论(0)