2020年高三数学一轮复习备战2021必备知识梳理-16-统计初步概率与统计的综合应用理科.docxVIP

2020年高三数学一轮复习备战2021必备知识梳理-16-统计初步概率与统计的综合应用理科.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

备战2021高三数学一轮复习必备知识梳理

16统计初步、概率与统计的综合应用

一、随机抽样与样本分布

1.随机抽样

(1)简单随机抽样

①定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的时机都相等,就把这种抽样方法叫作简单随机抽样.?

②最常用的简单随机抽样方法:抽签法和随机数法.?

(2)系统抽样

在抽样时,将总体分成均衡的假设干局部,然后按照预先制定的规那么,从每一局部抽取一个个体,得到所需要的样本,这种抽样方法叫作系统抽样(也称为机械抽样或等距抽样).?

【方法】系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.

(3)分层抽样

在抽样时,将总体按其属性特征分成假设干层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫作分层抽样.

【方法】进行分层抽样的相关计算时,常利用以下关系式巧解:

(1)样本容量n

(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.

2.用样本的频率分布估计总体分布

(1)①样本的数字特征:众数、中位数、平均数.

方差与标准差:s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)

s=1n

②平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.?

(2)样本的频率分布

①画频率分布直方图的步骤:a.求极差,即一组数据中的最大值与最小值的差;b.决定组距与组数;c.将数据分组;d.列频率分布表;e.画频率分布直方图.?

在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积的总和等于1.?

②频率分布折线图和总体密度曲线

a.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.

b.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线.?

(3)茎叶图的优点

在样本数据较少时,用茎叶图表示数据的效果更好,它不但可以保存所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.

二、相关关系与统计案例

1.相关关系与回归分析

(1)利用散点图判断相关性

①在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.?

②在散点图中,点散布在从左上角到右下角的区域,对于两个变量的这种相关关系,我们将它称为负相关.?

③如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系.?

(2)利用相关系数判断相关性

当r0时,说明两个变量正相关;当r0时,说明两个变量负相关.r的绝对值越接近于1,说明两个变量的线性相关性越强;r的绝对值越接近于0,说明两个变量之间几乎不存在线性相关关系.通常|r|大于时,认为两个变量有很强的线性相关关系.?

(3)线性回归方程(回归直线方程)

①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法.?

②回归方程:两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程为y^=b^

那么b^=∑i=1n(xi-x-)(yi-

(4)残差分析

相关指数:R2=∑i=1n(yi-y^i)2∑i=1n(yi-

2.独立性检验

(1)利用随机变量K2来判断“两个分类变量有关系〞的方法称为独立性检验.?

(2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(2×2列联表)为

y1

y2

总计

x1

a

b

a+b

x2

c

d

c+d

总计

a+c

b+d

a+b+c+d

那么随机变量K2=n(ad-bc)2(a+b)(a+

可利用独立性检验的临界值表来判断“X与Y有关系〞的可信度.

【方法】利用等高条形图和独立性检验判断两个分类变量是否有关系

(1)等高条形图:

在2×2列联表中,假设两个分类变量没有关系,那么应满足ad-bc≈0.|ad-bc|越小,说明两个分类变量之间关系越弱;|ad-bc|越大,说明两个分类变量之间关系越强.

(2)独立性检验是对两个分类变量有关系的可信程度的判断,而不是对它们是否有关系的判断.

三、概率与统计的综合应用

1.统计与离散型随机变量分布列的综合

求解离散型随机变量的数学期望的一般步骤:

文档评论(0)

192****9423 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档