高中数学概率统计讲义+练习含答案解析 20、回归分析.docxVIP

  • 0
  • 0
  • 约1.08万字
  • 约 29页
  • 2025-09-18 发布于河北
  • 举报

高中数学概率统计讲义+练习含答案解析 20、回归分析.docx

回归分析

知识与方法

1.残差:用回归方程拟合两个变量x和y之间关系时,对于样本点,,…,,称为相对于点的残差.将所有样本点的残差绘制成图形即可得到残差图,残差点比较均匀地落在水平带状区域中,且这样的区域越窄,模型的拟合效果越好.例如,下面是用两个不同的线性回归模型和对同一组观测数据进行拟合以及对应的残差图,对比可得线性回归模型的残差点分布在x轴附近狭窄的带状区域内,拟合效果相对更好.

2.相关指数:,对于已经获取的样本数据,分母部分是确定的数,分子部分是残差平方和,相关指数越大,意味着残差平方和越小,拟合效果越好.

3.非线性回归:通过变换(取对数、取指数、平方等)转化为线性回归模型计算,有关考题一般会给出参考数据.例如,若一组观测数据,,…,的散点图如图1所示,若用线性回归模型拟合(如图2),效果就比用指数模型拟合差(如图3).而欲求模型中的a和b,可以两端取自然对数,得到,此时可设,则,于是就将这一y关于x的非线性拟合转化成了z关于x的线性拟合.这里用到的变换,就是取对数.我们可以将观测数据,,…,变换成,,…,,再用最小二乘法求得z关于x的线性回归方程,再将z换回成即可.

提醒:很多同学比较怕非线性回归的考题,实际上,由于这类题一般都会给出大量参考数据,所以计算量在同类问题中不算大,它主要的难点在于读懂题意,厘清问题.

4.常见的非线性回归模型

(1)指数函数型(且,)

两边取自然对数,,即,

令,原方程变为,然后按线性回归模型求出,.

(2)对数函数型

令,原方程变为,然后按线性回归模型求出,.

(3)幂函数型

两边取常用对数,,即,

令,原方程变为,然后按线性回归模型求出,.

(4)二次函数型

令,原方程变为,然后按线性回归模型求出,.

(5)反比例函数型型

令,原方程变为,然后按线性回归模型求出,.

典型例题

1.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费和年销售量数据作了初步处理,得到下面的散点图及一些统计量的值.

46.6

563

6.8

289.8

1.6

1469

108.8

表中,

(1)根据散点图判断,与哪一个适宜作为年销售量y关于年宣传费x的回归方程类型?(给出判断即可,不必说明理由)

(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程;

(3)已知这种产品的年利润z与x、y的关系为,根据(2)的结果回答下列问题:

(i)年宣传费时,年销售量及年利润的预报值是多少?

(ii)年宣传费x为何值时,年利润的预报值最大?

附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为:

,.

【解析】(1)由散点图可以判断,适宜作为年销售量y关于年宣传费x的回归方程类型.

(2)令,则,先建立y关于w的线性回归方程,

由所给数据,,,

所以y关于w的线性回归方程为,故y关于x的回归方程为.

(3)(i)由(2)知,当时,年销售量y的预报值,

年利润z的预报值

(ii)由(2)知年利润z的预报值

所以当,即时,取得最大值,

故当年宣传费为46.24千元时,年利润预报值最大.

2.某公司生产一种产品,从流水线上随机抽取100件产品,统计其质量指数并绘制频率分布直方图(如图1):

产品的质量指数在的为三等品,在的为二等品,在的为一等品,该品的三、二、一等品的销售利润分别为每件1.5、3.5、5.5(单位:元),以这100件产品的质量指数位于各区间的频率代替产品的质量指数位于该区间的概率.

(1)求每件产品的平均销售利润;

(2)该公司为了解年营销费用x(单位:万元)对年销售量y(单位:万件)的影响,对近5年的年营销费用和年销售量数据做了初步处理,得到散点图(如图2)及一些统计量的值.

16.30

24.87

0.41

1.64

表中,,,

根据散点图判断,可以作为年销售量y(万件)关于年营销费用x(万元)的回归方程.

(i)建立y关于x的回归方程(参考数据:);

(ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?(收益=销售利润-营销费用)

参考公式:对于一组数据,,其回归直线的斜率和截距的最小二乘估计分别为:

,.

【解析】(1)设每件产品的销售利润为元,则的所有可能取值为1.5,3.5,5.5,

由频率分布直方图可得,一、二、三等品的频率分别为0.4,0.45,0.15,

所以,,,故随机变量的分布列为:

1.5

3.5

5.5

P

0.15

0.45

0.4

所以,故每件产品的平均销售利润为4元.

(2)(i)由得,令,,,则,

由表中数据可得,,

所以,即,

因为,所以,故y关于x的回归方程为

(ii)设年收益为z万

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档