- 1、本文档共57页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一、变量间的相关关系 1.两个变量间的关系 (1)函数关系,即确定性关系. (2)相关关系,即非确定性关系. 2.相关关系的分类 从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为_______,点分布在左上角到右下角的区域内,两个变量的相关关系为_______. 二、两个变量的线性相关 1.从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有______________,这条直线叫__________. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法. (2)线性回归方程: 3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中(______)称为样本点的中心. (3)相关系数 当r0时,表明两个变量_______; 当r0时,表明两个变量_______. r的绝对值越接近于1,表明两个变量的线性相关性_______. r的绝对值越接近于0,表明两个变量之间______________ _______________.通常|r|大于______时,认为两个变量有很强的线性相关性. 三、独立性检验 1.分类变量:变量的不同“值”表示个体所属的_________,像这类变量称为分类变量. 2.2×2列联表 假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为: 3.独立性检验的方法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查下表确定临界值k0. (3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 1.判断下面结论是否正确(请在括号中打“√”或“×”) (1)利用样本点的散点图可以直观判断两个变量是否具有线性相关关系.( ) (2)如果两个变量之间线性不相关,则这两个变量一定不存在线性回归方程.( ) (4)独立性检验的方法类似于反证法.( ) (5)由回归方程进行预报时,仅是一个预测值,而不是真实发生的值.( ) [答案及提示] (1)√ (2)× 这两个变量之间存在线性回归方程,但此回归方程毫无意义. (3)√ (4)√ (5)√ 2.下面哪些变量是相关关系( ) A.出租车车费与行驶的里程 B.房屋面积与房屋价格 C.身高与体重 D.铁块的大小与质量 解析:选C 由相关关系的概念知选项C满足,而选项A、B、D均为函数关系.故选C. 3.在研究吸烟与患肺癌的关系过程中,通过收集、整理、分析数据得到“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法正确的是( ) A.100个吸烟者中至少有99人患有肺癌 B.1个人吸烟,那么这个人有1%的概率患有肺癌 C.在100个吸烟者中一定有患肺癌的人 D.在100个吸烟者中可能一个患肺癌的人也没有 解析:选D “吸烟与患肺癌有关”是一种统计关系,这种关系是指“吸烟的人患肺癌的可能性更大”,而不是说“吸烟的人一定患肺癌”.99%以上的把握仅是指“吸烟与患肺癌有关”的可信程度,但也有在100个吸烟者中一个患肺癌的人也没有的可能.故选D. 4.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表: 解析:5% 由K2=4.8443.841. 故认为选修文科与性别有关系出错的可能性约为5%. 5.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表: 1.(2013·湖北高考)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论: 其中一定不正确的结论的序号是( ) A.①② B.②③ C.③④ D.①④ 解析:选D ①中y与x负相关而斜率为正,不正确; ④中y与x正相关而斜率为负,不正确.故选D. 解析:选D 因为所有的点都在直线上,所以是确定的函数关系,相关系数为1.故选D. 3.已知变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( ) A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正
文档评论(0)