- 1、本文档共78页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
10-3 变量间的相关关系与统计案例要点
1 2 3 4 5 6 7 8 9 10 城市居民 年收入x (亿元) 32.2 31.1 32.9 35.8 37.1 38.0 39.0 43.0 44.6 46.0 某商品销售额y (万元) 25.0 30.0 34.0 37.0 39.0 41.0 42.0 44.0 48.0 51.0 课时作业(五十一) P(K2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 课时作业 课堂互动探究 课前自主回顾 与名师对话 高考总复习 · 课标版 · A 数学(文) 考纲要求 考情分析 1.会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆). 本节内容为新课标中的新增内容,主要考查线性回归分析和独立性检验的统计分析方法,题型多以选择题和填空题为主.2012年课标卷3、湖南卷5考查了线性回归内容,福建卷18以解答题形式考查了线性回归方程的求法及用回归方程进行预测等知识,题目新颖. 预测:2013年高考仍延续这种考查形式,单独考查以选择、填空形式出现,难度不大,也可能作为解答题中一问与其他知识结合命题,应予以关注. 相关关系 相关关系 正相关 负相关 线性相关关系 回归直线 最小二乘法 相关关系 未知参数 e 正相关 负相关 越强 几乎不存在线性相关关系 0.75 随机误差 越小 越好 越好 不同类别 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 独立性假设 课时作业 课堂互动探究 课前自主回顾 与名师对话 高考总复习 · 课标版 · A 数学(文) (对应学生用书P196)
1.变量间的相关关系
(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是;与函数关系不同,是一种非确定性关系.
(2)从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为,点分布在左上角到右下角的区域内,两个变量的相关关系为.
2.两个变量的线性相关
(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫.
(2)回归直线方程为,其中=,
=.
=x+
-
(3)最小二乘法:通过求Q=(yi-xi-)2的最小值而得到回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做,用它可求出上述回归直线方程.
问题探究1:相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量的关系.
不同点:(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
3.回归分析
(1)定义:对具有的两个变量进行统计分析的一种常用方法.
(2)随机误差:线性回归模型用y=bx+a+e表示,其中a和b为模型的,称为随机误差.
(3)样本点的中心
在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中,回归方程的截距和斜率的最小二乘估计公式分别为:
=,=.
其中(,)称为样本点的中心.
-
(4)相关系数
当r0时,表明两个变量;
当r0时,表明两个变量.
r的绝对值越接近于1,表明两个变量的线性相关性.r的绝对值越接近于0时,表明两个变量之间.通常|r|大于时,认为两个变量有很强的线性相关性.
4.残差分析
(1)总偏差平方和
把每个效应(观测值减去总的平均值)的平方加起来即:
.
(2)残差
数据点和它在回归直线上相应位置的差异(yi-i)是的效应,称为相应于点(xi,yi)的残差.
i=yi-i
(3)残差平方和.
(4)相关指数
R2=1-R2的值越大,说明残差平方和,也就是说模型的拟合效果.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归的效果.
5.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的,像这样的变量称为分类变量.
(2)2×2列联表:假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称2×2列联表)为:
K2=(其中n=a+b+c+d为样本容量).
(3)独立性检验
利用随机变量、来确定是否一定有把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.
问题探究2:根据独立性检验的基本思想,得出的两个分类变量有关系,这样的结论一定是正确的吗?
提示:在实际问题中,独立性检验的结论仅仅是一种数学关系,得出的结论也可能犯错误,比如:在推测吸烟与肺癌是否有关时,通过收集、整理、分析数据,我们得
文档评论(0)