数据拟合方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据拟合方法数据拟合方法

第二讲 数据拟合方法 在实验科学、社会科学和行为科学中,实验和戡测常常会产生大量的数据。为了解释这些数据或者根据这些数据做出预测、判断,给决策者提供重要的依据。需要对测量数据进行拟合,寻找一个反映数据变化规律的函数。数据拟合方法与数据插值方法不同,它所处理的数据量大而且不能保证每一个数据没有误差,所以要求一个函数严格通过每一个数据点是不合理的。数据拟合方法求拟合函数,插值方法求插值函数。这两类函数最大的不同之处是,对拟合函数不要求它通过所给的数据点,而插值函数则必须通过每一个数据点。例如,在某化学反应中,测得生成物的质量浓度y (10 –3 g/cm3)与时间t (min)的关系如表所示 t 1 2 3 4 6 8 10 12 14 16 y 4.00 6.41 8.01 8.79 9.53 9.86 10.33 10.42 10.53 10.61 显然,连续函数关系y(t)是客观存在的。但是通过表中的数据不可能确切地得到这种关系。何况,由于仪器和环境的影响,测量数据难免有误差。因此只能寻求一个近拟表达式 y = (t) 寻求合理的近拟表达式,以反映数据变化的规律,这种方法就是数据拟合方法。数据拟合需要解决两个问题:第一,选择什么类型的函数作为拟合函数(数学模型);第二,对于选定的拟合函数,如何确定拟合函数中的参数。 数学模型应建立在合理假设的基础上,假设的合理性首先体现在选择某种类型的拟合函数使之符合数据变化的趋势(总体的变化规律)。拟合函数的选择比较灵活,可以选择线性函数、多项式函数、指数函数、三角函数或其它函数,这应根据数据分布的趋势作出选择。为了问题叙述的方便,将例1的数据表写成一般的形式 t x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 y y1 y2 y3 y4 y5 y6 y7 y8 y9 y10 一.线性拟合(线性模型) 假设拟合函数是线性函数,即拟合函数的图形是一条平面上的直线。而表中的数据点未能精确地落在一条直线上的原因是实验数据的误差。则下一步是确定函数 y= a + b x 中系数a和bt 各等于多少?从几何背景来考虑,就是要以a和b作为待定系数,确定一条平面直线使得表中数据所对应的10个点尽可能地靠近这条直线。一般来讲,数据点将不会全部落在这条直线上,如果第k个点的数据恰好落在这条直线上,则这个点的坐标满足直线的方程,即 a + b xk = y k 如果这个点不在直线上,则它的坐标不满足直线方程,有一个绝对值为的差异(残差)。于是全部点处的总误差是 这是关于a和b的一个二元函数,合理的做法是选取a和b ,使得这个函数取极小值。但是在实际求解问题时为了操作上的方便,常常是求a和b使得函数 达到极小。为了求该函数的极小值点,令 ,, 得 , 这是关于未知数a和b的线性方程组。它们被称为法方程,又可以写成 求解这个二元线性方程组便得待定系数a和b,从而得线性拟合函数 y = a + b x。下图中直线是数据的线性拟合的结果。 二.二次函数拟合(二次多项式模型) 假设拟合函数不是线性函数,而是一个二次多项式函数。即拟合函数的图形是一条平面上的抛物线,而表中的数据点未能精确地落在这条抛物线上的原因是实验数据的误差。则下一步是确定函数 y = a0 + a1 x + a2 x 2 中系数a0、a1和a2t 各等于多少?从几何背景来考虑,就是要以a0、a1和a2为待定系数,确定二次曲线使得表中数据所对应的10个点尽可能地靠近这条曲线。一般来讲,数据点将不会全部落在这条曲线上,如果第k个点的数据恰好落在曲线上,则这个点的坐标满足二次曲线的方程,即 a0 + a1 xk + a2 xk 2 = yk 如果这个点不在曲线上,则它的坐标不满足曲线方程,有一个误差(残差)。于是全部点处的总误差用残差平方和表示 这是关于a0、a1和a2的一个三元函数,合理的做法是选取a0、a1和a2 ,使得这个函数取极小值。为了求该函数的极小值点,令 ,, 得 这是关于待定系数a0、a1和a2的线性方程组,写成等价的形式为 这就是法方程,求解这一方程组可得二次拟合函数中的三个待定系数。下图反映了例题所给数据的二次曲线拟合的结果 三. 数据的n次多项式拟合 x x1 x2 …… xm f(x) y1 x2 …… ym 已知函数在个离散点处的函数值,假设拟合函数是n次多项式,则需要用所给数据来确定下面的函数 y = a0 + a1 x + a2 x 2 + …… + an x n 这里要做一个假设,即多项式的阶数n应小于题目所给数据的数目m(例题中m = 10)。类似前面的推导,可得数据的n次多项式拟合中拟合函数的系

文档评论(0)

cxiongxchunj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档