成对数据的统计分析讲义-2024届高三数学一轮复习.docxVIP

成对数据的统计分析讲义-2024届高三数学一轮复习.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

PAGE1

第02讲成对数据的统计分析

【必备知识】

1、变量的相关关系

(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.

(2)相关关系的分类:正相关和负相关.

(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,称这两个变量线性相关.

2、样本相关系数

(1)样本相关系数

(2)当,成对样本数据正相关;当时,成对样本数据负相关.

(3)当越接近1时,成对样本数据的线性相关程度越强;

当越接近0时,成对样本数据的线性相关程度越弱.

3、一元线性回归模型

(1)经验回归方程为,其中.

(2)残差分析

①观测值:通过观测得到的数据.

②预测值:通过经验回归方程得到的.

③残差:观测值减去预测值的差.

④残差分析:通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等.这方面的工作称为残差分析.

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

4.独立性检验

(1)假定通过简单随机抽样得到了X和Y的抽

样数据列联表,如表所示.

则.

(2)独立性检验

当时,推断不成立,即认为和不独立,该推断犯错误的概率不超过α;

当时,没有充分证据推断不成立,可以认为和独立.

利用χ2的取值推断分类变量和是否独立的方法称为独立性检验,简称独立性检验.

考点04相关关系的判断

【常见方法】判断相关关系的方法:

(1)回归方程法:利用回归方程中的系数的正负判断.

(2)散点图法:如果所有的样本点都落在某一曲线附近,那么变量之间就有相关关系;如果所有的样本点都落在某一直线附近,那么变量之间就有线性相关关系.

(3)相关系数法:利用相关系数判断,|r|越趋近于1,相关性越强.

【典例分析04】

1、为了对变量x与y的线性相关进行检验,由样本点(x1,y1)、(x2,y2)、…、(x10,y10)求得两个变量的样本相关系数为r,那么下面说法中正确的是()

A.若所有样本点都在直线y=-2x+1上,则r=1

B.若所有样本点都在直线y=-2x+1上,则r=-2

C.若越大,则变量x与y的线性相关性越强

D.若越小,则变量x与y的线性相关性越强

2、下列命题中正确的为()

A.线性相关系数r越大,两个变量的线性相关性越强

B.线性相关系数r越小,两个变量的线性相关性越弱

C.残差平方和越小的模型,模型拟合的效果越好

D.用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好

3、某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:

由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()

A.y=a+bxB.y=a+bx2

C.y=a+bexD.y=a+blnx

考点05线性回归方程

角度01线性回归方程及其应用

【常见方法】求线性回归方程的基本步骤

(1)先把数据制成表,从表中计算出x、y,xeq\o\al(\s\up1(2),\s\do1(1))+xeq\o\al(\s\up1(2),\s\do1(2))+…+xeq\o\al(\s\up1(2),\s\do1(n))、x1y1+x2y2+…+xnyn的值;

(2)计算回归系数;

(3)写出线性回归方程.

注意:回归方程一定过点(x,y).

【典例分析05】

1、某食品厂2020年2月至6月的某款饮料生产产量(单位:万件)的数据如下表:

月份x

2

3

4

5

6

生产产量y/万件

3

5

6.5

8

10.5

(1)根据以上数据,求y关于x的线性回归方程;

(2)调查显示该年7月份的实际市场需求量为13.5万件,求该年7月份所得回归方程预测的生产产量与实际市场需求量的误差.

参考公式:,.

角度02相关系数及其应用

【常见方法】1.模型拟合效果的判断

(1)残差平方和越小,模型的拟合效果越好;

(2)决定系数R2越大,模型的拟合效果越好;

(3)回归方程的拟合效果,可以利用相关系数判断.当|r|越趋近于1时,两变量的线性相关程度越强.

2.确定残差系数

.其中是残差平方和,其值越小,则越大(接近1),模型的拟合效果越好.

2、某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据

文档评论(0)

聚好信息咨询 + 关注
官方认证
服务提供商

本公司能够提供如下服务:办公文档整理、试卷、文档转换。

认证主体鹤壁市淇滨区聚好信息咨询服务部
IP属地河南
统一社会信用代码/组织机构代码
92410611MA40H8BL0Q

1亿VIP精品文档

相关文档