回归分析在数模竞赛中的应用_1.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归分析在数模竞赛中的应用_1

PAGE 1 PAGE 7 回归分析在数模竞赛中的应用 §1 回归分析的基本思想 在实际问题中,我们会遇到各种变量,在变量与变量之间,往往存在着各种关系。 有些变量之间的关系是确定性的函数关系,例如,圆的半径与圆面积之间的关系,自由落体落下的时间与落下的距离之间的关系,等等。在这些关系中,只要自变量的值确定了,因变量的值也就随之确定了。 但是,有些变量之间的关系就不是这样,例如,农作物的施肥量与农作物的产量之间的关系,商品的价格与商品的销售量之间的关系,家庭的收入与家庭的支出之间的关系,父亲的身高与儿子的身高之间的关系,等等。在这些关系中,自变量的值确定了,因变量的值并不完全随之确定,还是可能有上下起伏的变化。同时,在这些关系中,自变量与因变量又不是完全无关的,通过大量的统计数据,可以发现,它们之间确实存在着某种关系。我们把这样的关系,称为统计相关关系。 回归分析(Regression Analysis),就是研究变量之间的统计相关关系的一种统计方法。它从自变量和因变量的一组观测数据出发,寻找一个函数式,将变量之间的统计相关关系近似地表达出来。这个能够近似表达自变量与因变量之间关系的函数式,称为回归方程或回归函数。 §2 回归分析问题的一般形式 设有个自变量 和1个因变量 ,它们之间有下列关系: , 其中, 是函数形式已知的 元函数, 是常数,是函数 中的未知参数, 是表示误差的随机变量,一般可认为 ~, 。 对 , 进行 次观测,得到观测值: , 。 对每一次观测来说,同样有下列关系 , 其中 是第 次观测时的随机误差,。 回归分析目标是:从观测数据出发,求 的估计 ,使得下列平方和 达到最小: 。 由于估计的目标是使一个平方和达到最小,而平方又称为“二乘”,所以,这种估计称为最小二乘估计(Least Squares Estimator,简称LSE),求这种估计的方法称为最小二乘法(Method of Least Squares)。 把 代入 表达式,就得到的最小值 。 的最小值称为残差平方和,残差平方和越小,说明回归方程表达变量之间统计相关关系的精确程度越高,也就是回归分析的效果越好。 在数模竞赛中,经常会遇到可以用回归分析来解决的问题,下面是一些例子。 例1(1993年全国数模竞赛A题)非线性交调的频率设计 在一个电子通讯系统中,对输入信号强度和输出信号强度进行观测,得到下列数据: 051020304050608002.256.8020.1535.7056.4075.1087.8598.50 已知与之间的关系,是一个次数为3次的多项式: , 作为非线性交调的频率设计的第一步,需要求出这个关系式。 这里,是自变量,是因变量,是未知参数。问题是要从和的观测值数据出发,求出参数的估计。显然,这是一个回归分析问题。 例2(1993年国际数模竞赛A题)加速餐厅剩菜堆肥的生成 一家自助餐厅,每天把顾客吃剩下的食物搅拌成浆状,混入厨房里废弃的碎绿叶菜和少量撕碎的报纸,再加入真菌和细菌,混合物原料在真菌和细菌的消化作用下生成堆肥。 下表给出了以磅为单位的混合物原料中各种成分的的数据,以及混合物原料喂入的日期和堆肥生成的日期: 食物浆绿叶菜纸片原料喂入日期堆肥生成日期8631090.7.1390.8.1011279090.7.1790.8.137121090.7.2490.8.200382090.7.2790.8.227928090.8.1090.9.1210552090.8.1390.9.1812115090.8.2090.9.2411032090.8.2290.8.228244991.4.3091.6.185760691.5. 291.6.207751791.5. 791.6.255238691.5.1091.6.28 要求确定:混合物原料中各种成分的比例与堆肥生成的速率之间是否有关系?如果有关系,怎样的比例才能使得堆肥生成的速度最快? 设分别是食物浆、绿叶菜和纸片在混合物原料中的比例,是生成堆肥所需要的时间。要尝试给出与之间的关系式。可以考虑各种不同形式的关系,最简单的,可以认为它们之间有线性关系: , 其中,是自变量,是因变量,是未知参数。问题是要从和的观测值数据出发,求出参数的估计(由于是各种成分在总量中的比例,它们之间有的关系,3个自变量实际上不是独立的,为了避免估计结果的不确定,实际上还应该去掉一个自变量)。显然,这也

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档