- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高考一轮复习讲义:10.4 变量间的相关关系、统计案例
第四节 变量间的相关关系、统计案例
变量间的相关关系、统计案例
1.变量间的相关关系
(1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系.
(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
2.统计案例
了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.
(1)独立性检验
了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
(2)回归分析
了解回归分析的基本思想、方法及其简单应用.
知识点一 回归分析
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.
(2)回归方程为eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^)),其中eq \o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x) \x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x).
(3)通过求Q=eq \o(∑,\s\up6(n),\s\do4(i=1)) (yi-bxi-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法.
(4)相关系数:
当r0时,表明两个变量正相关;
当r0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
易误提醒
1.易混淆相关关系与函数关系,两者的区别是函数关系是???种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(eq \x\to(x),eq \x\to(y))点,可能所有的样本数据点都不在直线上 .
3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值).
[自测练习]
1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为eq \o(y,\s\up6(^))=0.95x+eq \o(a,\s\up6(^)),则eq \o(a,\s\up6(^))=( )
x0134y2.24.34.86.7A.3.25 B.2.6
C.2.2 D.0
解析:∵回归直线必过样本点的中心(eq \x\to(x),eq \x\to(y)),又eq \x\to(x)=2,eq \x\to(y)=4.5,代入回归方程,得eq \o(a,\s\up6(^))=2.6.
答案:B
2.(2016·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系.
解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D.
答案:D
知识点二 独立性检验
独立性检验
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=eq \f(n?ad-bc?2,?a+b??a+c??b+d??c+d?)(其中n=a+b+c+d为样本容量).
易误提醒 (1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.
(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释.
[自测练习]
3.下面是2×2列联表:
y1
您可能关注的文档
最近下载
- BSL-2 实验室生物安全手册.docx VIP
- 部编人教版《道德与法治》一年级上册第三、四单元教材分析.ppt VIP
- 电动机控制实践教学教案.pdf VIP
- RS Components 电工电料 电流互感器 CMS2050-SP7 使用说明.pdf VIP
- 液压油缸的初步知识与装配.ppt VIP
- 弯曲零件展开料长的计算.docx VIP
- 大一新生班干部竞选演讲稿【课件】.pptx
- DL_T 5754-2017 高清版 智能变电站工程调试质量检验评定规程.docx VIP
- 2025年低压电工证(复审)考试笔试试题(600题)附答案.pdf VIP
- 2024年广东省高职高考语文试卷及答案 .pdf VIP
文档评论(0)