- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.1 回归分析的基本思想及其初步应用;学习目标
1.了解随机误差、残差、残差图的概念.
2.会通过分析残差判断线性回归模型的拟合效果.
3.掌握建立回归模型的步骤.
4.通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.;课前自主学案;;(2)线性回归模型y=bx+a+e,其中a和b为模型的未知参数,e称为_________.
(3)随机误差产生的原因主要有以下几种:
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.;2.刻画回归效果的方式
(1)残差分析
①残差:把随机误差的估计值i称为相应于点(xi,yi)的残差.
②残差图:作图时______为残差,______可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.
残差点比较____地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度____,说明模型拟合精度越高.;解释;;课堂互动讲练;某班5名学生的数学和物理成绩如下表:;(1)画出散点图;
(2)求物理成绩y对数学成绩x的回归直线方程;
(3)一名学生的数学成绩是96,试预测他的物理成绩.
【思路点拨】 先画散点图,分析物理与数学成绩是否有线性相关关系,若相关再利用线性回归模型求解预报变量.;【解】 (1)散点图如图:;【思维总结】 求回归直线方程的一般方法是:作出散点图,将问题所给的数据在平面直角坐标系中进行描点,这样表示出的两个变量的一组数据的相关图形就是散点图,从散点图中我们可以判断样本点是否呈条状分布,进而判断两个变量是否具有相关关系.;互动探究1 在本例中,求数学成绩y对物理成绩x的回归直线方程,并预测当一名学生的物理成绩是82时,其数学成绩为多少?;通过对残差图的分析,得出模型的拟合效果
已知某种商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:;求y对x的回归直线方程,并说明回归模型拟合效果的好坏.;列出残差表:;【思维总结】 回归模型拟合效果的好坏可以通过计算R2来判断,其值越大,说明模型的拟合效果越好.;变式训练2 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影响,对不同重量的6个物??进行测量,数据如下表所示:;解:(1)散点图如图;(2)列表如下:;(3)由残差表中的数值可以看出第3个样本点的残差比较大,需要确认在采集这个数据的时候是否有人为的错误,如果有的话,需要纠正数据,重新建立回归模型;由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高,由以上分析可知,弹簧长度与拉力成线性关系.;方法技巧
1.对具有相关关系的两个变量进行统计分析时,首先进行相关关系的判断(可作散点图),在确认具有线性相关关系后,再求回归直线方程.对于非线性回归问题,可以转化为线性回归问题去解决.如例1.;失误防范;1.2 独立性检验的基本思想及其初步应用;学习目标
1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
2.了解假设检验的基本思想、方法及其简单应用.;课前自主学案;1.2×2列联表与等高条形图
(1)分类变量的定义
变量的不同“值”表示个体所属的________,像这样的变量称为分类变量.
(2)2×2列联表的定义
一般地,假设有两个分类变量X和Y,它们的取值分别为________和________,其样本频数列联表(称为2×2列联表)为:;;(3)与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用__________展示列联表数据的频率特征.;a+b+c+d;(1)如果k≥10.828,就有______的把握认为“X与Y有关系”;
(2)如果k≥7.879,就有______的把握认为“X与Y有关系”;
(3)如果k≥6.635,就有99%的把握认为“X与Y有关系”;
(4)如果k≥5.024,就有97.5%的把握认为“X与Y有关系”;
(5)如果k≥3.841,就有95%的把握认为“X与Y有关系”;
(6)如果k≥2.706,就有____的把握认为“X与Y有关系”.;1.分类变量的值就是指的一些具体实数吗?
提示:这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等.;2.在判断两变量相关时,若K2的观测值k=56.632,则P(K2≥6.635)≈0.01和P(K2≥10.828)≈0.001,哪种说法是正确的?
提示:两种说法均正确.
P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下,认为两变量相关;
而P(K2≥10.828)≈0.001的含义是在犯错误的概率不超过0.001的前提下,
文档评论(0)