网站大量收购独家精品文档,联系QQ:2885784924

最优子集回归在福建热带气旋年频数预测中的应用.doc

最优子集回归在福建热带气旋年频数预测中的应用.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最优子集回归在福建热带气旋年频数预测中的应用 Ξ 最优子集回归在福建热带气旋 年频数预测中的应用 高建芸 许金镜 ()福建省气候中心 , 福州 摘要 ( ) 用相关分析方法普查了影响福建省热带气旋 TC年频数与前期北半球 500hPa 和 100hPa 月平均位势高度场 、北太平洋海温场以及 500hPa 月环流特征量的关系 , 分析影响福建 TC 年 频数的前期大气环流及海温场特征 , 寻找与福建 TC 年频数关系密切的预测因子 , 采用 “两段 () 筛选”的思路 , 选用逐步回归筛选出 M 个 10 个左右预报因子 , 再用最优子集回归建立预 报模型 , 其效果较为理想 。 关键词 : 最优子集回归 , 热带气旋年频数 , 预测 。 一 、资料和预报因子的选取 11 资料 ( ) 选取 1951,1996 年北半球 500hPa 月平均高度场 5?×10网格?点、北半球 100hPa 月 () () 平均高度场 10?×10网格?点、太平洋月平均海温场 286 个 5?×5网格?点和 500hPa 月 环流 ( ) 特征量作为预报因子的分析素材 , 取 1951,1996 年影响福建热带气旋 简称 TC年 频数为预报对象 。 21 预报因子的选取 对上一年 1 月至当年 4 月每个因子场进行相关普查 , 寻找预报福建 TC 年频数的预报 因子 。所选因子满足以下条件 : () 1相关系数大于 0129 , 达信度标准 0105 。 () 2选取三个以上格点的相关系数大于 0129 连成一片的区域为显著相关区 。若相关 区格点数较多 , 以相关系数较大且连成一片的区域为相关区 , 相关区内所有格点值平均构 Ξ 本文于 1998 年 8 月收到 。 造出一个预报因子序列 。 二 、方法简述 () 鉴于逐步回归用于建立预测模型时存在一些缺点和问题 : 1逐步回归可视为按选取 方差贡献大的因子为准则进行的一种子集回归 , 因此 , 所建立的模型不一定是全局最优 。 () () 2F 临界值不好确定 。 3回归方程的检验流于形式 。而最优子集回归采取合理途径 、 穷尽所有预报因子的搭配 , 选择回归效果最好的子集回归 , 确保筛选出的预报因子组合是 最优 。这也是最优子集回归正逐步替代逐步回归的原因 。 1 本文采用双评分准则作为模式识别准则, 定义 : ()CS C = S 1 + S 2 1 其中 : ( )( ) S 1 = N - K1 - Q / Q KY G G G G ( ) S 2 = 2 I = 2 [ n1 nn+ N 1 nN - n. 1 nn1 +n1 1 nn1 ]ijj i i jj??? ? i = 1 i = 1 i = 1 i = 1 式中 S 1 为数量评分 , 即为精评分 , S 2 为趋势评分 , 即为粗评分 。N 为样本长度 , K 为 统计模式中变量个数 , Q 为模型的残差平方和 , Q为模型总离差平方和 。由此可见 , 双 K Y 评分准则旨在使模型拟合的精度越好 , 趋势亦准 。 用双评分准则作为模式判别准则的最优子集回归的计算 , 就是按照一定的顺序求出一 ( ) 切可能子集回归的 CS C 值 , 然后确定最大值 , 如果 CS C XX?X= max , 则其所对应 i1 i2 ik 的子集回归方程 ββββY = + X+ X+ ?X 0 i1 i1 i2 i2 ik ik 就是最优子集回归方程 。 ( 本文采用 “两段筛选”的思路 , 选用逐步回归控制 F 检验值 , 筛选出 M 个 10 个左 ) 右预报因子 , 再计算 M 个变量的全部可能回归寻找最优子集 , 建立预报模型 , 实验证 明 , 最优子集回归的预报效果比逐步回归好 。 [2 ] ( ( ) ) 对 TC 预测评分采用平均绝对误差 E和预测效率 R F, 其中 : f 0 ()E = 1/ N | X- X|2 i i 0 ? ( ) ( ) R F = N + f ×N + f ×N / N + f ×N + f ×N ×100 % ()3 1 1 2 20 1 1 2 2 2 期 高建芸等 : 最优子集回归在福建热带气旋年频数预测中的应用 51 f 0 () 2式中 E 为平均绝对误差 , X表示第次的预测值 , X表示第次预测相应的实际 i i () ( 值 , N 为预测总次数 , 显然 E 越小越好 。3式中 R F 为预测效率 , N 为预测正确 指 0 0 ) ( 预测与实况的绝对误差小于 015 个的次数 。N 和 f 分别为一级异常 指预测与实况的 1 1 )( 绝对误差大于等于 015 个且小于 115 个

文档评论(0)

ryaoo + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档