3.2 回归分析与应用.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

回归分析及应用

一.基本原理

一.相关性检验

1.相关系数:

2.相关系数r的性质

(1)当r0时,称成对样本数据正相关;当r0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.

(2)样本相关系数r的取值范围为[-1,1].

当|r|越接近1时,成对样本数据的线性相关程度越强;

当|r|越接近0时,成对样本数据的线性相关程度越弱.

二.线性回归与最小二乘法

1回归直线方程过样本点的中心,是回归直线方程最常用的一个特征

2我们将称为关于的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的叫做b,a的最小二乘估计,其中

3残差的概念

对于响应变量,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.

4刻画回归效果的方式

(i)残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.

(ii)残差平方和法:残差平方和,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.

(iii)利用刻画回归效果:决定系数是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.,越大,即拟合效果越好,越小,模型拟合效果越差.

5.常见的几个非线性回归模型

模型1,其中为常数.

将两边取对数,得,令,从而得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.

模型2,其中为常数.

令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.

模型3,其中为常数.

,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.

模型4反比例函数模型:

令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.

模型5.三角函数模型:

令,则变换后得到与的线性经验回归方程,用公式求即可,这样就建立了与非线性经验回归方程.

二.典例分析

例1.(2022年全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:

样本号

1

2

3

4

5

6

7

8

9

10

总和

根部横截面积

0.04

0.06

0.04

0.08

0.08

0.05

0.05

0.07

0.07

0.06

0.6

材积量

0.25

0.40

0.22

0.54

0.51

0.34

0.36

0.46

0.42

0.40

3.9

并计算得,,.

(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;

(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);

(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.

附:相关系数,.

例2.2023年3月5日,国务院总理李克强在政府工作报告中指出“着力扩大消费和有效投资.面对需求不足甚至出现收缩,推动消费尽快恢复.帮扶旅游业发展.围绕补短板、调结构、增后劲扩大有效投资.”某旅游公司为确定接下来五年的发展规划,对2013~2022这十年的国内旅客人数作了初步处理,用和分别表示第年的年份代号和国内游客人数(单位:百万人次),得到下面的表格与散点图.

年份

2013

2014

2015

2016

2017

2018

2019

2020

2021

2022

年份代码x

1

2

3

4

5

6

7

8

9

10

国内游客数y

3262

3611

3990

4432

5000

5542

6006

2879

3246

2530

(1)2020年~2022年疫情特殊时期,旅游业受到重挫,现剔除这三年的数据,再根据剩余样本数据(,2,3,…,7)建立国内游客人数关于年份代号的一元线性回归模型;

(2)2023年春节期间旅游市场繁荣火爆,预计2023年国内旅游人数约4550百万人次,假若2024年~2027年能延续2013年~2019年的增长势头,请结合以上信息预测2027年国内游客人数.

附:回归直线的斜率和截距的最小二乘估计公式分别为:,

参考数据:,

例3.数据显示,中国在线直播用户规模及在线直播购物规模近几年都保持高速增长态势,下表为2017-202

您可能关注的文档

文档评论(0)

hyqhyqhyq616 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档