- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
回归分析及应用
一.基本原理
一.相关性检验
1.相关系数:
2.相关系数r的性质
(1)当r0时,称成对样本数据正相关;当r0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.
(2)样本相关系数r的取值范围为[-1,1].
当|r|越接近1时,成对样本数据的线性相关程度越强;
当|r|越接近0时,成对样本数据的线性相关程度越弱.
二.线性回归与最小二乘法
1回归直线方程过样本点的中心,是回归直线方程最常用的一个特征
2我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中
3残差的概念
对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.
4刻画回归效果的方式
(i)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.
(ii)残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.
(iii)利用刻画回归效果:决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.,越大,即拟合效果越好,越小,模型拟合效果越差.
5.常见的几个非线性回归模型
模型1,其中为常数.
将两边取对数,得,令,从而得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.
模型2,其中为常数.
令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.
模型3,其中为常数.
,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.
模型4反比例函数模型:
令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.
模型5.三角函数模型:
令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.
二.典例分析
例1.(2022年全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
例2.2023年3月5日,国务院总理李克强在政府工作报告中指出“着力扩大消费和有效投资.面对需求不足甚至出现收缩,推动消费尽快恢复.帮扶旅游业发展.围绕补短板、调结构、增后劲扩大有效投资.”某旅游公司为确定接下来五年的发展规划,对2013~2022这十年的国内旅客人数作了初步处理,用和分别表示第年的年份代号和国内游客人数(单位:百万人次),得到下面的表格与散点图.
年份
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
年份代码x
1
2
3
4
5
6
7
8
9
10
国内游客数y
3262
3611
3990
4432
5000
5542
6006
2879
3246
2530
(1)2020年~2022年疫情特殊时期,旅游业受到重挫,现剔除这三年的数据,再根据剩余样本数据(,2,3,…,7)建立国内游客人数关于年份代号的一元线性回归模型;
(2)2023年春节期间旅游市场繁荣火爆,预计2023年国内旅游人数约4550百万人次,假若2024年~2027年能延续2013年~2019年的增长势头,请结合以上信息预测2027年国内游客人数.
附:回归直线的斜率和截距的最小二乘估计公式分别为:,
参考数据:,
例3.数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-202
您可能关注的文档
- 第62讲重难点突破02 利用传统方法求线线角、线面角、二面角与距离 (九大题型)(解析版).docx
- 第62讲重难点突破02 利用传统方法求线线角、线面角、二面角与距离 (九大题型)(原卷版).docx
- 第63讲重难点突破03 立体几何解答题常考模型归纳总结(九大题型)(原卷版).docx
- 第64讲拔高点突破01 立体几何中的截面、交线问题(九大题型)(解析版).docx
- 第64讲拔高点突破01 立体几何中的截面、交线问题(九大题型)(原卷版).docx
- 第65讲拔高点突破02 立体几何中的动态、轨迹问题(六大题型)(解析版).docx
- 第65讲拔高点突破02 立体几何中的动态、轨迹问题(六大题型)(原卷版).docx
- 第66讲拔高点突破03 立体几何中的常考压轴小题(七大题型)(解析版).docx
- 第66讲拔高点突破03 立体几何中的常考压轴小题(七大题型)(原卷版).docx
- 第67讲拔高点突破04 新情景、新定义下的立体几何问题(六大题型)(原卷版).docx
- 人教版九年级英语全一册单元速记•巧练Unit13【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit9【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit11【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit14【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit8【速记清单】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit4【单元测试·提升卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit13【单元测试·基础卷】(原卷版+解析).docx
- 人教版九年级英语全一册单元速记•巧练Unit7【速记清单】(原卷版+解析).docx
- 苏教版五年级上册数学分层作业设计 2.2 三角形的面积(附答案).docx
- 人教版九年级英语全一册单元速记•巧练Unit12【单元测试·基础卷】(原卷版+解析).docx
最近下载
- 空调主机吊装方案.docx
- 基层儿科医务人员服务能力提升学习班答案-2024华医网继续教育答案.docx VIP
- 部编 人教版小学二年级上册语文教学课件 5.课文 14.我要的是葫芦 .pptx VIP
- 让“工具包”理念和方法落地.pdf VIP
- 国家开放大学《可编程控制器应用实训》形考任务2(实训二)参考答案.docx
- 4.2 实现中华民族伟大复兴的中国梦 课件(18张PPT)-2023-2024学年高中政治统编版必修一中国特色社会主义.pptx VIP
- 费森尤斯CRRT操作流程.doc VIP
- 五年级上册英语期中试卷人教精通版.pdf VIP
- 第17课昆明的雨(课件)(共27张PPT).pptx VIP
- 小学信息技术(信息科技)第六册泰山版(2018)合集.docx
文档评论(0)