高考一轮复习讲义:10.4 变量间的相关关系、统计案例.doc

高考一轮复习讲义:10.4 变量间的相关关系、统计案例.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高考一轮复习讲义:10.4 变量间的相关关系、统计案例

第四节 变量间的相关关系、统计案例 变量间的相关关系、统计案例 1.变量间的相关关系 (1)会作两个有关联变量的数据的散点图,会利用数点图认识变量间的相关关系. (2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 2.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. (1)独立性检验 了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用. (2)回归分析 了解回归分析的基本思想、方法及其简单应用. 知识点一 回归分析 1.变量间的相关关系 (1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系. (2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2.两个变量的线性相关 (1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线. (2)回归方程为eq \o(y,\s\up6(^))=eq \o(b,\s\up6(^))x+eq \o(a,\s\up6(^)),其中eq \o(b,\s\up6(^))=eq \f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x) \x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),eq \o(a,\s\up6(^))=eq \x\to(y)-eq \o(b,\s\up6(^))eq \x\to(x). (3)通过求Q=eq \o(∑,\s\up6(n),\s\do4(i=1)) (yi-bxi-a)2的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫作最小二乘法. (4)相关系数: 当r0时,表明两个变量正相关; 当r0时,表明两个变量负相关. r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性. 易误提醒  1.易混淆相关关系与函数关系,两者的区别是函数关系是???种确定的关系,而相关关系是一种非确定的关系,函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系. 2.回归分析中易误认为样本数据必在回归直线上,实质上回归直线必过(eq \x\to(x),eq \x\to(y))点,可能所有的样本数据点都不在直线上 . 3.利用回归方程分析问题时,所得的数据易误认为准确值,而实质上是预测值(期望值). [自测练习] 1.已知x,y的取值如下表,从散点图可以看出y与x线性相关,且回归方程为eq \o(y,\s\up6(^))=0.95x+eq \o(a,\s\up6(^)),则eq \o(a,\s\up6(^))=(  ) x0134y2.24.34.86.7A.3.25          B.2.6 C.2.2 D.0 解析:∵回归直线必过样本点的中心(eq \x\to(x),eq \x\to(y)),又eq \x\to(x)=2,eq \x\to(y)=4.5,代入回归方程,得eq \o(a,\s\up6(^))=2.6. 答案:B 2.(2016·镇江模拟)如图所示,有A,B,C,D,E 5组(x,y)数据,去掉________组数据后,剩下的4组数据具有较强的线性相关关系. 解析:由散点图知呈带状区域时有较强的线性相关关系,故去掉D. 答案:D 知识点二 独立性检验 独立性检验 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=eq \f(n?ad-bc?2,?a+b??a+c??b+d??c+d?)(其中n=a+b+c+d为样本容量). 易误提醒 (1)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. (2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释. [自测练习] 3.下面是2×2列联表: y1

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档