- 0
- 0
- 约1.91千字
- 约 4页
- 2026-02-11 发布于河南
- 举报
PAGE1/NUMPAGES4
破解回归分析三个关键问题
回归分析是统计案例重要内容之一,本文对回归分析所涉及的知识点以问题形式进行归纳,希望对同学们有所帮助。
问题一:如何利用回归分析的方法对两个具有线性相关关系的变量进行研究呢?
回答:利用回归分析的方法对两个具有线性相关关系的变量进行研究的步骤为:
(1)画出两个变量的散点图;(2)求回归直线方程;(3)用回归直线方程进行预报。
其中求回归直线方程是关键,而对于线性回归模型来说,估计模型中的未知参数的最好方法就是用最小二乘法估计,其计算公式为,
例1、一台机器由于使用时间较长,但还可以使用,它按不同的转速生产出来的某及其零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度变化,下表是抽样试验结果:
转速x(转/秒)
16
14
12
8
每小时生产有缺点的零件数y/件
11
9
8
5
(1)如果y与x具有线性相关关系,求线性回归方程;
(2)若实际生产中,允许每小时的产品中有缺点的零件数最多为10个,那么机器的转速应该控制在什么范围内?
解:(1)由题意得,,
则,,
所以y关于x的线性回归方程为y=0.7286x-0.8575.
(2)要使,即,解得
因此,机器的转速应该控制在15转/秒以下。
点评:本题中准确求出回归方程是作出正确判断的前提。
问题二:判断解释变量x与预报变量y是否具有线性相关关系,先作出散点图,从点的分布特征来判定是否线性相关。那么,如果作图不准,出现误差怎么办?怎样更好地判定两个变量相关关系的强弱?
回答:给定样本数据(i=1,2,…,n),单纯由散点图判定其是否大致在一条直线附近直观性太强,回归分析时通常还用相关系数r来检验两个变量之间线性相关关系的强弱。样本相关系数的具体计算公式为:,r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近0,表明两个变量之间几乎不存在线性相关关系,通常当|r|大于0.75时,认为两个变量有很强的线性相关关系。
例2、假设关于某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:
年限x(年)
2
3
4
5
6
费用y(万元)
2.2
3.8
5.5
6.5
7.0
(1)判断是否线性相关;如果线性相关,求出线性回归方程;
(2)求相关指数,并说明模型的拟合度。
解:设使用年限x(年)是解释变量,维修费用y(万元)是预报变量。
(1)画出散点图如下图:
由散点图可知y对x是线性相关的,计算相关系数得,由于0.9760.75,因此有较强的线性相关关系,设线性回归方程为,计算得,即得线性回归方程为
(2),由于接近1,说明模型拟合度较高。其使用年限解释了95.87%的维修费用支出。
点评:通过相关指数来衡量回归模型的拟合度是一种重要的方法。在线性回归模型中,反映了回归平方和在总偏差平方和中所占的比重,该比重越大,残差平方和在总偏差平方和中所占的分量就越小,模型的拟合度则越高。因此,相关指数越大,模型的拟合度越高;越小,模型的拟合度越低。
问题三:课本上大多是研究线性回归问题,那么非线性回归问题如何进行统计分析呢?
回答:对于非线性回归问题进行回归分析的方法是:画出已知数据的散点图,通过与各种函数(如指数函数、对数函数、幂函数等)的图像作比较,选择一种与这些散点拟合得最好的函数,然后采用适当的变量变换,将问题化为线性回归分析问题来解决。若题目中已给出转换公式,则可直接运用,不必画图。
例3、《格林童话》这本书非常受学生的欢迎,某厂家想投资印刷,已知图书的成本费y(千元)与印刷册数y(千册)有关,经统计得到数据如下:
x
1
2
4
8
16
32
64
128
y
10
13
17.8
24.5
35
47.4
65
93
书的成本费y与印刷册数的开方之间是否有线性相关关系,如果有,求出y与x的回归方程。
解:首先作变量变换,令u=,则题目所给数据变成如下表所示的数据:
u
1
2
2
4
4
8
8
y
10
13
17.8
24.5
35
47.4
65
93
可以求得r=0.9998,由r=0.99980.75,因此变量y与u之间具有很强的线性相关关系,并且计算得到,最后回代u=可得,因此y与x的回归方程为.
点评:本题中通过变量变换,即令u=,并通过对u与y作相关性检验,判定出y与u之间具有很强的线性相关关系后,求出y对u的回归直线方程,最后再回代u=,得到y对x的回归方程。
原创力文档

文档评论(0)