知识精讲:变量间的相关关系、回归分析及独立性检验.doc

知识精讲:变量间的相关关系、回归分析及独立性检验.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
知识精讲:变量间的相关关系、回归分析及独立性检验知识精讲:变量间的相关关系、回归分析及独立性检验

变量间的相关关系、回归分析及独立性检验 【知识精讲】 1.会作两个相关变量的数据的散点图,会利用散点图认识变量的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 3.掌握独立检验(只要求2×2列联表)的基本思想、方法简单应用. 4. 掌握假设检验和聚类分析的基本思想、方法简单应用. 【基础梳理】 1.相关关系的量:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系. 2.回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析. 3.散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图. 4.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关.如果散点图中的点散布在从左上角到右下角的区域内,称为负相关. 相关系数:r=叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 7.相关系数的性质:|r|≤1,且|r|越接近1,相关程度越大;且|r|越接近0,相关程度越小. 8.独立性检验:一般地,假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 2×2列联表 若要推断的论述为H1:X与Y有关系,可以按如下步骤判断结论H1成立的可能性: (1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度. ①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上的两个柱形高度的乘积bc相差越大,H1成立的可能性就越大. ②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例 ,也可以估计满足条件X=x2的个体中具有Y=y2的个体所占的比例.“两个比例的值相差越大,H1成立的可能性就越大.” (2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.具体做法是: ①根据实际问题需要的可信程度确定临界值k0; ②利用公式K2= ,由观测数据计算得到随机变量K2的观测值k; ③如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据. 【要点解读】 要点七 相关关系的判断 【例7】山东鲁洁棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg). (1)画出散点图; (2)判断是否具有相关关系. 【命题立意】考查相关关系的分析方法. 【标准解析】用施化肥量x作为横轴,产量y为纵轴可作出散点图,由散点图即可分析是否具有线性相关关系. 【误区警示】正确选择坐标描点,并准确观察散点的实际分布判断两变量的正相关和负相关是常用方法. 【答案】(1)散点图如右图所示, [来源:学.科.网Z.X.X.K] (2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系. 【变式训练】(2009·宁夏、海南)对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u、v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断(  ) A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 【标准解析】由图(1)可知,各点整体呈递减趋势,x与y负相关,由图(2)可知,各点整体呈递增趋势,u与v正相关. 【技巧点拨】注意正负相关的判断标准. 【答案】C 要点八 线性回归分析 【例8】一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:[来源:学科 (1)对变量y与x进行相关性检验; (2)如果y与x有线性相关关系,求回归直线方程; (3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么,机器的运转速度应控制在什么范围内? 【命题立意】考查线性回归分析方法。 【标准解析】利用相关系数r进行线性相关检验(也可利用散点图).如果线性相关,再求回归直线方程并加以判断. 【答案】 [来源:Zxxk.Com] 【变式训练】假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料: (1)y与x间是否有线性相关关系?若有,求出线性回

文档评论(0)

cxiongxchunj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档