SVM方法在释用中的应用的研究%3a预报因子选择.pdfVIP

  • 2
  • 0
  • 约2.62千字
  • 约 4页
  • 2017-08-13 发布于安徽
  • 举报

SVM方法在释用中的应用的研究%3a预报因子选择.pdf

SVM方法在释用中的应用研究:预报因子选择 王在文 (北京城市气象研究所100089) 摘要 1 方法介绍 本文介绍一个应用SVM(支持向量机)方法预报2-m温度的实例中不同预报因 子选择对预报效果的影响。 给定训练样本集 (Xl,Y1),(x2,Y2)…….,(xf,yf) 模式M(x),使其不但对于训练样本集满足yi=M(xi),而且对于预报数据集: Xl+l,Xl+2,……,Xm 同样能得到满意的对应输出值Yi。 当yle{.1,1}时为最简单的二类划分,当yi∈{l,2一….,k}时为k类划分,当yieR 时为函数估计,即回归分析,本文为回归分析。 SVM方法在释用方面具有如下优点: (1)传统的统计方法只有在样本数趋向无穷大时其性能才有理论上的保证。 对于应用中的有限样本难以取得理想的效果。SVM方法是~种小样本学习方法。 (2)SVM可以给出学习结果的推广能力的界。 (3)SVM是一种处理非线性分类和非线性回归的有效方法。 (4)SVM方法的计算量与样本向量的维数几乎无关,这在某种意义上避免了 “维数灾”。 2实验设计 个预报量可以作为预报因子来预报海淀站的2-m温度,具体如下: 1 度降水)、PSEA(海平面气压)、T02、V10、U10。 260 以上126个因子几乎涵盖了所有脚5V2模式输出的预报量,这些物理量与被预 报量具有不同的相关性,取全部预报量作为建模因子的主要目的就是为了避免遗漏可 能对SVM建模预报具有较大影响的因子。但是与预报量相关很差因子的引入可能淡化 对预报量具有相对重要性的因子的权重,因此必须对建模因子进行取舍。另外由于数 值模式的输出具有较好的时间连续性,其反映的预报因子变化倾向可能与预报量的变 化倾向具有潜在相关,因此可以尝试将其纳入建模因子中。 以下实例研究中,方法一取所有126个因子建模,方法二引入时间变化倾向, 方法三选取与预报量关系比较密切的物理量作为预报因子,方法四在方法三的基础上 引入时间变化倾向。 3实例研究 以下是对这126个因子进行处理后生成的预报因子集对海淀站2-m温度36小时 预报的预报集的实况、SVM建模、MM5V2预报结果对比情况。 以下为四种预报因子的处理方式及其预报集2-m温度的实况、SVM建模预报值、 ‘ 腓5V2模式预报值的对比图: 1)预报因子为MM5V2模式预报相应的36小时预报站点值,由站点周围四个网 格点上的预报值插值而成。由以上126个预报因子归一化后生成值: 全部样本随机排列,共分为三个样本集:训练集、检验集、预报集,样本数分 别为:676、196、50,总样本数为922。 2)预报因子由方法一中126个预报因子归一化值以及归一化后其值的24小时 变量共252个预报因子组成: 训练集、检验集、预报集,样本数分别为:676、196、50,总样本数为922。 261 3)选取与2-m温度相对关系比较好的预报因子,为站点周围4个网格点上 PSEA、T02、VlO、UIO共80个预报因子的归一化值。 训练集、检验集、预报集,样本数分别为:697、178、47,总样本数为922。 4)预报因子由方法三中80个预报因子归一化值及其归一化值的24小时变量值 共160个因子组成: 训练集、检验集、预报集,样本数分别为:697、178、47,总样本数为922。 下表为预报集在四种因子选择方法的SVlVl建模预报以及MM5V2预报中的偏差、 绝对偏差、误差标准差以及均方根误差值: 统计量 MM5V2SVM方法建模 M匝涯5V2 SVIVI方法建模 (oC) 预报 方法一 方法二 预报 方法三 方法四 偏差

文档评论(0)

1亿VIP精品文档

相关文档