- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
§9.3成对数据的统计分析
课标要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.3.会利用统计软件进行数据分析.
1.变量的相关关系
(1)相关关系:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类:正相关和负相关.
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.
2.样本相关系数
(1)r=n∑
(2)当r0时,称成对样本数据正相关;当r0时,称成对样本数据负相关.
(3)|r|≤1;当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.
3.一元线性回归模型
(1)我们将y^=b^x+a^
其中b
(2)残差:观测值减去预测值所得的差称为残差.
4.列联表与独立性检验
(1)关于分类变量X和Y的抽样数据的2×2列联表:
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
(2)计算统计量χ2=n(ad?bc)2(a+b)(
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)散点图是判断两个变量相关关系的一种重要方法和手段.(√)
(2)经验回归直线y^=b^x+a^至少经过(x1,y1),(x2,y2),…,(xn,
(3)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.(√)
(4)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越小.(×)
2.(多选)下列说法正确的是()
A.两个具有线性相关关系的变量的相关性越强,则样本相关系数r的值越接近于1
B.当r=1时,两变量呈函数关系
C.当经验回归方程为y^=0.3-0.7x时,变量x和y
D.在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y
答案BC
解析两个具有线性相关关系的变量的相关性越强,则样本相关系数r的绝对值越接近于1,故A错误;当样本相关系数r=1时,两变量呈确定的函数关系,故B正确;因为斜率小于0,所以变量x和y负相关,故C正确;在经验回归方程y^=0.4+0.5x中,当x每增加1个单位时,相应观测值y
3.想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0为()
A.男性喜欢参加体育活动
B.女性不喜欢参加体育活动
C.喜欢参加体育活动与性别有关
D.喜欢参加体育活动与性别无关
答案D
解析独立性检验是一种假设性检验,假设有反证法的意味,应假设两类变量无关,在该假设下构造的随机变量χ2应该很小,如果χ2很小,则不能肯定或否定假设,反之,则在一定程度上说明假设不合理,即认为两个变量在一定程度上有关,所以想要检验喜欢参加体育活动是不是与性别有关,应该提出统计假设H0:喜欢参加体育活动与性别无关.
4.已知变量x和y的统计数据如表:
x
6
7
8
9
10
y
3.5
4
5
6
6.5
若由表中数据得到经验回归方程为y^=0.8x+a^,则当x=10时的残差为(注:观测值减去预测值所得的差称为残差)
答案-0.1
解析x=6+7+8+9+10
y=3.5+4+5+6+6.5
则a^=5-0.8×
所以y^=0.8x-1.4,当x=10时,y
所以当x=10时的残差为6.5-6.6=-0.1.
1.经验回归直线过点(x,y).
2.求b^时,常用公式b
3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.
题型一成对数据的相关性
例1(1)(多选)(2025·绵阳模拟)下列说法正确的是()
A.回归分析中,样本相关系数r的取值范围为(-1,1)
B.回归分析中,残差图中残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.回归分析中,决定系数R2越大,说明残差平方和越小,拟合效果越好
D.两个随机变量的线性相关性越强,样本相关系数的绝对值越接近于0
答案BC
解析回归分析中,样本相关系数r的取值范围为[-1,1],故选项A错误;
因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,模型的拟合效果越好,故选项B正确;
因为决定系数R2越大,表示残差平方和越小,数据就越集中,即模型的拟合效果越好,故选项C正确;
两个随机变量的线性相关性越强,样本相关系数的绝对值越接近于1,故D错误.
(2)已知变量x与变量y线性相关,x与y的样本相关系数为-0.8,且由观测数据算得样本平均数x=5,y=6,则由该观测数据算得的经验回归方程可能是(
您可能关注的文档
最近下载
- 2025年医疗器械经营质量管理制度、工作程序文件目录.pdf VIP
- 浅谈小学数学核心素养之运算能力.pdf VIP
- 2023年我国蚕桑产业发展态势与未来发展建议.docx VIP
- 电力变压器声纹检测技术导则.docx VIP
- 调度员考核管理细则梳理.docx VIP
- 《建设工程施工合同》GF2024—0201.docx VIP
- 会计师事务所的执业质量控制制度.pdf VIP
- 2021《森林消防队伍基础设施、装备及制度建设标准》.pdf VIP
- 《水利水电工程单元工程施工质量验收评定标准-地基处理与基础工程》(SL 633-2012).pdf VIP
- (高清版)-B-T 2423.18-2021 环境试验 第2部分:试验方法 试验Kb:盐雾,交变(氯化钠溶液).pdf VIP
为中小学学生教育成长提供学习参考资料,学习课堂帮助学生教师更好更方便的进行学习及授课,提高趣味性,鼓励孩子自主进行学习,资料齐全,内容丰富。
文档评论(0)