- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学人教A版选修2-3教材梳理:3.1回归分析的基本思想及其初步应用Word版含解析
庖丁巧解牛
知识·巧学
一、回归直线方程
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计公式分别为:=,
=.
回归直线方程中的=称为样本点的中心.回归直线过样本点的中心.
二、相关系数及相关检验
给定(xi,yi)(i=1,2,…,n),只要x1,x2,…,xn不全相等,就能求出一条回归直线,因此它有无意义就是个大问题.由于根据散点图看数据是否大致在一直线附近主观性太强,可利用下面量化的检验法.
当xi不全相等,yi也不全相等时,r=.
叫做变量y与x之间的样本相关系数(简称相关数),|r|≤1.
当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近0时,表明两个变量之间几乎不存在线性相关关系.
通常,当r的绝对值大于0.75时认为两个变量有很强的线性相关关系.
联想发散 注意此处空半格当|r|与1接近到什么程度才表明Y与x之间具有线性相关关系呢?为明确这一点,常通过相关性检验的方法,其步骤如下:
(1)作统计假设:x与Y不具有线性相关关系;
(2)根据小概率0.05与n-2在附表中查出r的一个临界值r0.05;
(3)根据样本相关系数计算公式算出r的值;
(4)作统计推断,如果|r|>r0.05,表明有95%的把握认为x与y之间具有线性相关关系.如果|r|≤r0.05,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的.
三、回归分析
1.随机误差
在线性回归模型y=bx+a+e中,a和b为模型的未知参数,e是y与=bx+a之间的误差,通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=σ20.
线性回归模型的完整表达形式为在此模型中,随机误差r的方差σ2越小,通过回归直线=bx+a预报真实值y的精度越高.
深化升华 注意此处空半格引起随机误差e的原因:(1)在实际中,随机变量y除了受随机变量x的影响之外,还受其他变量的影响;(2)由于前面相关关系公式中的和为截距和斜率的估计值,它们与真实值a和b之间也存在误差.
2.方差分析
对于样本点(x1,y1),(x2,y2),…(xn,yn)而言,相应于它们的随机误差为
ei=yi-=yi-bxi-a(i=1,2,…,n),其估计值为=yi-=yi-xi-(i=1,2,…,n),称为相应于点(xi,yi)的残差.类比样本方差估计总体方差的思想,可以用2=Q(,)(n>2)作为的估计量,其中和由公式给出,Q(,)称为残差平方和.可以用衡量回归直线方程的预报精度.通常越小,预报精度越高.
要点提示 注意此处空半格因为随机误差是随机变量,因此可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机变量的均值为0,因此可以用方差σ2来衡量随机误差的大小.
3.残差分析
在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用线性回归模型来拟合数据.然后,可以通过残差,来判断模型拟合的效果,判断原始数据中是否存在可疑数据.这方面的分析工作称为残差分析.其中残差是数据点yi和它在回归线上相应位置之间的差异,即=yi-.
4.相关指数R2
用相关指数R2来刻画回归的效果,其计算公式是:R2=
显然R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好.
深化升华 注意此处空半格在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率.R2越接近于1,表示回归的效果越好(因为R2越接近于1,表示解释变量和预报变量的相关性越强).如果对某组数据可能采取几种不同的回归方程进行回归分析.也可以通过比较几个R2,选择其值大的模型.
四、建立回归模型的基本步骤
(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;
(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);
(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+a);
(4)按一定规则估计回归方程中的参数(如最小二乘法);
(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等),若存在异常,则检查数据是否有误,或模型是否合适等.
问题·探究
问题1两个变量具有线性相关关系和两个变量具有函数关系相同吗?你对二者关系是如何理解的?
思路:相关关系与函数关系不同,因为函数关系是一种确定性的关系,而相关关系是一种非确定性关系.相关
您可能关注的文档
- 广西钦州市钦州港经济技术开发区中学高二上学期期中综合检测考试地理试卷Word版含答案.docx
- 广西钦州市钦州港经济技术开发区中学高二上学期期中综合检测考试地理试卷Word版含解析.docx
- 强化训练03(文)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练02(文)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练01(理)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练02(理)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练03(理)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练04(文)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练04(理)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 强化训练06(文)-高考数学备考艺体生百日突围系列Word版含解析.doc
- 数学人教A版选修2-3教案:1.1分类加法计数原理和分步乘法计数原理第三课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.2.1排列第三课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.1分类加法计数原理和分步乘法计数原理第四课时Word版含解析.doc
- 数学人教A版选修2-3教材梳理:1.3二项式定理Word版含解析.doc
- 数学人教A版选修2-3教材梳理:3.2独立性检验的基本思想及其初步应用Word版含解析.doc
- 数学人教A版选修2-3教案:1.2.2组合第三课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.1分类加法计数原理和分步乘法计数原理第一课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.2.2组合第一课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.1分类加法计数原理和分步乘法计数原理第二课时Word版含解析.doc
- 数学人教A版选修2-3教案:1.2.1排列第一课时Word版含解析.doc
文档评论(0)