第九章 §9.3 成对数据的统计分析.docx

第九章 §9.3 成对数据的统计分析.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

§9.3成对数据的统计分析

课标要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析.

1.变量的相关关系

(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.

(2)相关关系的分类:正相关和负相关.

(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.

2.样本相关系数

(1)r=n∑

(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.

(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.

3.一元线性回归模型

(1)我们将y^=b^x+a^

其中b

(2)残差:观测值减去预测值所得的差称为残差.

4.列联表与独立性检验

(1)关于分类变量X和Y的抽样数据的2×2列联表:

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

n=a+b+c+d

(2)计算统计量χ2=n(ad?bc)2(a+b)(

1.判断下列结论是否正确.(请在括号中打“√”或“×”)

(1)散点图是判断两个变量相关关系的一种重要方法和手段.(√)

(2)经验回归直线y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,

(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√)

(4)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越小.(×)

2.(多选)下列说法正确的是()

A.两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1

B.当r=1时,两变量呈函数关系

C.当经验回归方程为y^=0.3-0.7x时,变量x和y

D.在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y

答案BC

解析两个具有线性相关关系的变量的相关性越强,则样本相关系数r的绝对值越接近于1,故A错误;当样本相关系数r=1时,两变量呈确定的函数关系,故B正确;因为斜率小于0,所以变量x和y负相关,故C正确;在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y

3.想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为()

A.男性喜欢参加体育活动

B.女性不喜欢参加体育活动

C.喜欢参加体育活动与性别有关

D.喜欢参加体育活动与性别无关

答案D

解析独立性检验是一种假设性检验,假设有反证法的意味,应假设两类变量无关,在该假设下构造的随机变量χ2应该很小,如果χ2很小,则不能肯定或否定假设,反之,则在一定程度上说明假设不合理,即认为两个变量在一定程度上有关,所以想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0:喜欢参加体育活动与性别无关.

4.已知变量x和y的统计数据如表:

x

6

7

8

9

10

y

3.5

4

5

6

6.5

若由表中数据得到经验回归方程为y^=0.8x+a^,则当x=10时的残差为(注:观测值减去预测值所得的差称为残差)

答案-0.1

解析x=6+7+8+9+10

y=3.5+4+5+6+6.5

则a^=5-0.8×

所以y^=0.8x-1.4,当x=10时,y

所以当x=10时的残差为6.5-6.6=-0.1.

1.经验回归直线过点(x,y).

2.求b^时,常用公式b

3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.

题型一成对数据的相关性

例1(1)(多选)(2025·绵阳模拟)下列说法正确的是()

A.回归分析中,样本相关系数r的取值范围为(-1,1)

B.回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好

C.回归分析中,决定系数R2越大,说明残差平方和越小,拟合效果越好

D.两个随机变量的线性相关性越强,样本相关系数的绝对值越接近于0

答案BC

解析回归分析中,样本相关系数r的取值范围为[-1,1],故选项A错误;

因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,模型的拟合效果越好,故选项B正确;

因为决定系数R2越大,表示残差平方和越小,数据就越集中,即模型的拟合效果越好,故选项C正确;

两个随机变量的线性相关性越强,样本相关系数的绝对值越接近于1,故D错误.

(2)已知变量x与变量y线性相关,x与y的样本相关系数为-0.8,且由观测数据算得样本平均数x=5,y=6,则由该观测数据算得的经验回归方程可能是(

文档评论(0)

钟爱书屋 + 关注
官方认证
服务提供商

为中小学学生教育成长提供学习参考资料,学习课堂帮助学生教师更好更方便的进行学习及授课,提高趣味性,鼓励孩子自主进行学习,资料齐全,内容丰富。

认证主体韵馨科技(深圳)有限公司
IP属地广东
统一社会信用代码/组织机构代码
91440300MA5G40JF61

1亿VIP精品文档

相关文档