第03讲 成对数据的统计分析 (高频考点,精讲)(解析版).docxVIP

第03讲 成对数据的统计分析 (高频考点,精讲)(解析版).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第03讲成对数据的统计分析(精讲)

目录

第一部分:知识点精准记忆

第二部分:典型例题剖析

题型一:成对数据的相关性

题型二:回归分析

角度1:经验回归方程及应用

角度2:非线性经验回归方程及应用

角度3:相关系数

角度4:残差分析

题型三:列联表与独立性检验

第一部分:知

第一部分:知识点精准记忆

知识点一:变量的相关关系

(1)两个变量有关系,但又没有确切到可由其中一个去精确地决定另一个的程度,这种关系称为相关关系.

(2)正相关、负相关

从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.?

(3)线性相关、非线性相关

一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.?

一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.

知识点二:样本相关系数

(1)相关系数的计算

变量与变量的样本相关系数的计算公式如下:

(2)相关系数的性质

①当时,称成对样本数据正相关;当时,称成对样本数据负相关.

当时,成对样本数据间没有线性相关关系.

②样本相关系数的取值范围为,当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱.

知识点三:一元线性回归模型

(1)数学表述式:如果两个变量之间的关系可以表示为

我们称该式为关于的一元线性回归模型.

其中,称为因变量或响应变量,称为自变量或解释变量;和为模型的未知参数,称为截距参数,称为斜率参数;是与之间的随机误差.

(2)经验回归方程

我们将称为关于的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,其中

(3)利用刻画回归效果

的计算公式为,其意义是越大,残差平方和越小,即模型的拟合效果越好;越小,残差平方和越大,即模型的拟合效果越差.

知识点四:列联表与独立性检验

(1)2×2列联表

如图,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列联表.

合计

合计

(2)独立性检验

依据上述列联表构造统计量

利用的取值推断分类变量和是否独立的方法称为独立性检验,读作“卡方独立性检验”,简称独立性检验.

常用的小概率值和临界值表

0.1

0.05

0.01

0.005

0.001

2.706

3.841

6.635

7.879

10.828

第二部分:典型例题剖析

第二部分:典型例题剖析

题型一:成对数据的相关性

典型例题

例题1.(2022·全国·高三专题练习)某统计部门对四组数据进行统计分析后,获得如图所示的散点图.

下面关于相关系数的比较,正确的是()

A. B. C. D.

【答案】C

【详解】由图可知:所对应的图中的散点呈现正相关,而且对应的相关性比对应的相关性要强,故,所对应的图中的散点呈现负相关,且根据散点的分布情况可知,因此,

故选:C

例题2.(2022·北京·高二期末)对变量、由观测数据得散点图,对变量、由观测数据得散点图.由这两个散点图可以判断(????)

A.变量与负相关,与正相关

B.变量与负相关,与负相关

C.变量与正相关,与正相关

D.变量与正相关,与负相关

【答案】B

【详解】由散点图可知,变量与负相关,变量与正相关,所以,与负相关.

故选:B.

例题3.(2022·全国·高三专题练习)对于,两变量,有四组样本数据,分别算出它们的线性相关系数(如下),则线性相关性最强的是(????)

A.-0.82 B.0.78 C.-0.69 D.0.87

【答案】D

【详解】由相关系数的绝对值越大,变量间的线性相关性越强知:各选项中的绝对值最大.

故选:D

同类题型归类练

1.(2022·全国·高三专题练习)在下列4组样本数据的散点图中,样本相关系数最小的是(????)

A. B. C. D.

【答案】B

【详解】由散点图变化趋势可知,,,,,

又第2组散点图中的散点更为集中,更接近于一条直线,

所以,

故样本相关系数最小的是.

故选:B.

2.(多选)(2022·福建三明·高二期末)已知5个成对数据(x,y)的散点图如下,若去掉点D(4,3),则下列说法正确的是(????)

A.变量x与变量y呈负相关 B.变量x与变量y的相关性变强

C.残差平方和变小 D.样本相关系数r变大

【答案】ABC

【详解】由散点图可知,去掉点D后,与的线性相关加强,且为负相关,所以AB正确,

由于与的线性相关加强,所以残差平方和变小,所以C正确,

由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r变小,所以D错误,

故选:

文档评论(0)

159****5384 + 关注
实名认证
文档贡献者

擅长考试试题、教学课件。

1亿VIP精品文档

相关文档