- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 10 讲
回归分析与独立性检验
1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.
2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
3.了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.
(1)了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
(2)了解假设检验的基本思想、方法及其简单应用.
(3)了解回归的基本思想、方法及其简单应用.
1.变量间的关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另
一类是相关关系;与函数关系不同,相关关系是一种非确定性
关系.
(2)将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直
角坐标系中,表示两个变量关系的一组数据的图形叫做散点图.
(3)正相关、负相关.
在散点图中,点散布在从左下角到右上角的区域,对于两
个变量的这种相关关系称为正相关.
在散点图中,点散布在从左上角到右下角的区域,两个变
量的这种相关关系称为负相关.
2.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种
常用方法.
(2)线性相关关系:
观察散点图的特征,如果散点图中点的分布从整体上看大
致在一条直线附近,我们就称这两个变量之间具有线性相关关
系,这条直线叫做回归直线.
(3)回归直线的求法:
当 r0 时,表明两个变量________.
负相关
r 的绝对值越接近于 1,表明两个变量的线性相关性越强.
r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关
关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性.
(5)相关指数:
R2 的值越大,说明残差平方和越小,也就是说模型的拟合
效果越好.在线性回归模型中,R2 表示解释变量对于预报变量
变化的贡献率,R2 越接近于 1,表示回归的效果越好.
3.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类
别,像这类变量称为分类变量.
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
(2)列联表:列出两个分类变量的频数表,称为列联表.假
设有两个分类变量X 和Y,它们的可能取值分别为{x1,x2}和{y1,
y2},其样本频数列联表(称为 2×2 列联表)为
2×2 列联表
a+b+c+d
(3)独立性检验:
利用随机变量 K2 来判断“两个分类变量有关系”的方法
称为独立性检验.
1.有关线性回归的说法,不正确的是(
)
D
A.相关关系的两个变量是非确定关系
B.散点图能直观地反映数据的相关程度
C.回归直线最能代表线性相关的两个变量之间的关系
D.散点图中的点越集中,两个变量的相关性越强
2.(2013 年湖北)四名同学根据各自的样本数据研究变量 x,
y 之间的相关关系,并求得回归直线方程,分别得到以下四个
结论:
其中一定不正确的结论的序号是(
)
D
A.①②
B.②③
C.③④
D.①④
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
3.通过随机询问 110 名性别不同的大学生是否爱好某项运
动,得到如下的列联表:
0.050
0.010
0.001
k
3.841
6.635
10.828
附表:
参照附表,得到的正确结论是(
)
A
A.有 99%以上的把握认为“爱好该项运动与性别有关”
B.有 99%以上的把握认为“爱好该项运动与性别无关”
C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该
项运动与性别有关”
D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该
项运动与性别无关”
P(K2≥k)
广告费用 x/万元
4
2
3
5
销售额 y/万元
49
26
39
54
4.(2013 年广东江门一模)某产品的广告费用 x 与销售额 y
的统计数据如下表:
65.5
x
1
2
3
4
5
6
y
0
2
1
3
3
4
考点 1
线性回归分析
例 1:已知 x 与 y 之间的几组数据如下表:
答案:C
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
【互动探究】
1.(2014年湖北)根据如下样本数据:
解析:依题意,画散点图,如图 D52,两个变量负相关,
图 D52
答案:A
考点 2
独立性检验
例 2:(2014 年安徽)某高校共有 15 000 人,其中男生有 10
500 人,女生有 4500 人,为调查该校学生每周平均体育运动时
间的情况,采用分层抽样的方法,收集 300 位学生每周平均体
育运动时间的样本数据(单位:小时).
(1)应收集多少位女生样本数据
您可能关注的文档
最近下载
- 110kV线路工程预算报价书.pdf VIP
- 工程移交清单范本 .pdf VIP
- 广东省工程勘察设计服务成本取费导则(2024版).docx VIP
- 《网络操作系统-Windows Server 2012 R2配置与管理》全套教学课件.pptx VIP
- 2024-2025学年初中语文统编版(小初衔接)全册教学设计合集.docx
- 环网电缆施工方案.docx VIP
- 焚烧炉燃烧及调整.pptx VIP
- 2025年部编人教版五年级《道德与法治》上册教案(全册) .pdf VIP
- 2025年秋季新修订人教版七年级上册语文全册教学课件(新教材).pptx
- 湖北xx水库除险加固工程项目可行性研究报告.docx
文档评论(0)