- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2013高考数学(文)人教版二轮复习课件:9_6
热点考向三 独立性检验 考点自主整合 热点考向 聚集 高效课时作业 第六节 变量间的相关关系与统计案例 主讲:贾玉华 相关关系 随机性 一条直线附近 左下角 右上角 左上角 右下角 (y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2为最小 未知参数 相关关系 e 0.75 正相关 负相关. 越强. 几乎不存在线性相关关系. 2×2列联表 不同类别 频数 列联表 2×2列联表. 热点考向一 变量间的相关关系 热点考向二 线性回归方程
1.相关关系的定义
自变量取值一定时,因变量的取值带有一定的两个变量之间的关系叫相关关系.
2.散点图
作法:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,以表示具有的两个变量的一组数据的图形叫做散点图.散点图形象地反映了数据的密切程度,更能清楚地看出两变量是否有相关关系.
3.两个变量的线性相关
(1)正相关
在散点图中,点散布在从到的区域.对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从到的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
4.回归直线
(1)一般地,设x与y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程为=x+,则
我们将这个方程叫做回归直线方程,a、b叫做回归系数,相应的直线叫做回归直线.
(2)最小二乘法
使总体偏差平方和Q=的方法,叫做最小二乘法.
5.回归分析
(1)定义:对具有的两个变量进行统计分析的一种常用方法.
(2)随机误差:线性回归模型用y=bx+a+e表示,其中a和b为模型的,称为随机误差.
(3)样本点的中心
在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,用最小二乘估计模型y=bx+a+e中的未知参数a和b,则=,=-.
其中=xi,=yi,(,)称为样本点的中心.
(4)相关系数
①r=;
②当r>0时,表明两个变量;
当r<0时,表明两个变量r的绝对值越接近于1,表明两个变量的线性相关性r的绝对值越接近于0时,表明两个变量之间通常|r|大于时,认为两个变量有很强的线性相关性.
6.2×2列联表的独立性检验
(1)分类变量:变量的不同“值”表示个体所属的这类变量称为分类变量.
(2)列联表:列出的两个或两个以上的分类变量的表称为列联表.由两个分类变量的样本频数列联表称为(3)独立性检验
①独立性检验一般采用的形式,每个因素可以分为两个或两个以上的类别.当列联表是的形式时,独立性检验的公式如下:
K2=
(其中n=a+b+c+d).
2×2列联表
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d ②用K2的大小可以决定是否拒绝原来的统计假设H0,若K2值较大,就拒绝H0,即拒绝事件A与B无关.
(4)利用以下数据来确定“X与Y有关系”的可信程度.
如果k10.828,就有99.9%的把握认为“X与Y有关系”;
如果k7.897,就有99.5%的把握认为“X与Y有关系”;
如果k6.635,就有99%的把握认为“X与Y有关系”;
如果k5.024,就有97.5%的把握认为“X与Y有关系”;
如果k3.841,就有95%的把握认为“X与Y有关系”;
如果k2.706,就有90%的把握认为“X与Y有关系”;
如果k≤2.706,就认为没有充分的证据显示“X与Y有关系”.
1.若y与x之间的一组数据为:
x0 1 2 3 4 y 1 3 5 5 6 则拟合这5对数据的回归直线一定经过的点是( )
A.(1,3) B.(2,5)
C.(1.5,4) D.(3,7)
答案:C
2.(2011年山东)某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程=x+为9.4,据此模型预报广告费用为6万元时销售额为( )
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
3.(2011年江西)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4)(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则( )
A.r2r10 B.0r2r1
C.r20r
文档评论(0)