基于数据分析的建模方法.pptVIP

  • 13
  • 0
  • 约2.16千字
  • 约 26页
  • 2017-05-21 发布于浙江
  • 举报
基于数据分析的建模方法

二.经验模型的建立 * * * 基于数据分析的建模方法 * 在建立数学模型的过程中,经常需要建立 变量之间的关系. *由于对研究对象的内部机理不甚了解,不 能通过合理的假设,或根据物理定律、原理, 经过机理分析法而得到. 问题 解决思路 *选择适当的数学式对变量间的关系进行拟合. *通过对数据充分观察和分析, 获得数据所含 信息; *揭示变量间的内在联系; x o y * 借助于由实验或测量得到的一批离散数据. 两类变量关系 确定性关系 确定的函数关系 相关关系 存在相依关系,但未达到相互确定的程度. 两类数据 已知规律(函数)的测试数据(在特定时间点或距离上的数据) 呈现随机性的数据,可看成具有某种概率分布的随机样本值. 针对两种不同类型的数据, 有不同的建立模型方法: 1. 数据拟合法(适用于第一类数据) 基本思想 已知函数 y= f(x) 的一组测试数据 (xi , yi), (i=1,2,…,n), 寻求一个函数ψ(x),使ψ(x)对上述测试数据 的误差较小,即ψ(xi)≈yi,于是可以用ψ(x) 来近似替代f (x). 常用的数据拟合方法:一般插值法、最小二乘法、样条函数光顺法等. 插值法的基本思想 寻找 f(x)的近似替代函数 φ(x), 在插值节点xi 上满足 φ( xi )=yi, (i=1,2,…,n), 其余点用φ(x)近似替代f (x ), 称φ(x)为f (x)的 插值函数. 最小二乘法基本思想 寻找 f (x)的近似替代 函数φ(x), 使 2. 随机分析方法 对于随机数据进行拟合,可用统计学中的 回归分析方法或时间序列分析方法. 以上两种建模方法都是建立在对数据进行充分分析的基础上. 寻找或选择适当的函数拟合变量之间的关系 (函数关系或回归关系)是重要的环节. 一般步骤 1)绘制数据散点图; 2)分析数据散点图; 3)选择函数关系形式. 1) 通过分析数据散点图可以获得对变量间关系的感性认识, 形成初步的看法, 以便于对问题做进一步的分析. 氮施肥量N -土豆产量数据散点图 磷施肥量 -土豆产量数据散点图 2)分析数据散布图; 对数据散布图进行分析,可以分析出变量的 关系是: 1)线性的还是非线性的? 2)有无周期性? 3)呈现何种变化趋势?变化率如何? …,等等有用的初步结论. 例6.2.1 建立一个简洁的函数关系式来描述 某个地区人的身高和体重的对应关系, 数据 见表7.4(p156). 曲线特征是体重W 随身高H 的增长而单调增长,但可以观察到是非线性增长. 身高-体重数据散点图 练习 试分析以下问题 1. 氮施肥量N、磷施肥量 P 关于土豆产量的数据散点图. 2. 海浪潮高度x 随时间t 的数据散点图. 3)选择函数关系形式 1. 形式尽可能简洁, 尽可能线性化; 原则 2. 依据实际问题的精度要求,合乎实际规律. 续例6.2.1 选择幂函数 W= , 描述身高体重关系. 优点 此函数可以线性化. 两边取对数, 有 变换为线性函数 例6.2.2 可选二次函数 注:其中 b0= y(0) = 15.18. 描述氮肥施肥量与土豆产量间的变量关系. 关于磷肥施肥量和土豆产量的变量关系可 选择威布尔模型: 合理性? 3. y 是单调升函数. 也可以选择S 函数: S函数也满足: 3. y 是单调升函数; 哪个模型更好? 分析 S 模型所含参数更少, 另外若令 可得线性模型 回归模型是用统计分析方法建立的最常用的一类模型 数学建模的基本方法 机理分析 测试分析 通过对数据的统计分析,找出与数据拟合最好的模型 不涉及回归分析的数学原理和方法 通过实例讨论如何选择不同类型的模型 对软件得到的结果进行分析,对模型进行改进 由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。 牙膏的销售量 问题 建立牙膏销售量与价格、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量 收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价 9.26 0.55 6.80 4.25 3.70 30 7.93 0.05 5.80 3.85 3.80 29 ? ? ? ? ? ? 8.51 0.25 6.75 4.00 3.75 2 7.38 -0.05 5.50 3.80 3.85 1 销售量 (百万支) 价格差 (元) 广告费用 (百

文档评论(0)

1亿VIP精品文档

相关文档