- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
最优子集回归在福建热带气旋年频数预测中的应用
Ξ
最优子集回归在福建热带气旋
年频数预测中的应用
高建芸 许金镜
()福建省气候中心 , 福州
摘要
( ) 用相关分析方法普查了影响福建省热带气旋 TC年频数与前期北半球 500hPa 和 100hPa 月平均位势高度场 、北太平洋海温场以及 500hPa 月环流特征量的关系 , 分析影响福建 TC 年 频数的前期大气环流及海温场特征 , 寻找与福建 TC 年频数关系密切的预测因子 , 采用 “两段
() 筛选”的思路 , 选用逐步回归筛选出 M 个 10 个左右预报因子 , 再用最优子集回归建立预 报模型 , 其效果较为理想 。
关键词 : 最优子集回归 , 热带气旋年频数 , 预测 。
一 、资料和预报因子的选取
11 资料
( ) 选取 1951,1996 年北半球 500hPa 月平均高度场 5?×10网格?点、北半球 100hPa 月
() () 平均高度场 10?×10网格?点、太平洋月平均海温场 286 个 5?×5网格?点和 500hPa 月 环流
( ) 特征量作为预报因子的分析素材 , 取 1951,1996 年影响福建热带气旋 简称 TC年 频数为预报对象 。
21 预报因子的选取
对上一年 1 月至当年 4 月每个因子场进行相关普查 , 寻找预报福建 TC 年频数的预报 因子 。所选因子满足以下条件 :
() 1相关系数大于 0129 , 达信度标准 0105 。
() 2选取三个以上格点的相关系数大于 0129 连成一片的区域为显著相关区 。若相关 区格点数较多 , 以相关系数较大且连成一片的区域为相关区 , 相关区内所有格点值平均构
Ξ 本文于 1998 年 8 月收到 。
造出一个预报因子序列 。
二 、方法简述
() 鉴于逐步回归用于建立预测模型时存在一些缺点和问题 : 1逐步回归可视为按选取 方差贡献大的因子为准则进行的一种子集回归 , 因此 , 所建立的模型不一定是全局最优 。 () () 2F 临界值不好确定 。 3回归方程的检验流于形式 。而最优子集回归采取合理途径 、 穷尽所有预报因子的搭配 , 选择回归效果最好的子集回归 , 确保筛选出的预报因子组合是 最优 。这也是最优子集回归正逐步替代逐步回归的原因 。
1 本文采用双评分准则作为模式识别准则, 定义 :
()CS C = S 1 + S 2 1
其中 :
( )( ) S 1 = N - K1 - Q / Q KY
G G G G
( ) S 2 = 2 I = 2 [ n1 nn+ N 1 nN - n. 1 nn1 +n1 1 nn1 ]ijj i i jj??? ? i = 1 i = 1 i = 1 i = 1
式中 S 1 为数量评分 , 即为精评分 , S 2 为趋势评分 , 即为粗评分 。N 为样本长度 , K 为 统计模式中变量个数 , Q 为模型的残差平方和 , Q为模型总离差平方和 。由此可见 , 双 K Y
评分准则旨在使模型拟合的精度越好 , 趋势亦准 。
用双评分准则作为模式判别准则的最优子集回归的计算 , 就是按照一定的顺序求出一
( ) 切可能子集回归的 CS C 值 , 然后确定最大值 , 如果 CS C XX?X= max , 则其所对应 i1 i2 ik
的子集回归方程
ββββY = + X+ X+ ?X 0 i1 i1 i2 i2 ik ik
就是最优子集回归方程 。
( 本文采用 “两段筛选”的思路 , 选用逐步回归控制 F 检验值 , 筛选出 M 个 10 个左 ) 右预报因子 , 再计算 M 个变量的全部可能回归寻找最优子集 , 建立预报模型 , 实验证 明 , 最优子集回归的预报效果比逐步回归好 。
[2 ] ( ( ) ) 对 TC 预测评分采用平均绝对误差 E和预测效率 R F, 其中 :
f 0 ()E = 1/ N | X- X|2 i i 0 ?
( ) ( ) R F = N + f ×N + f ×N / N + f ×N + f ×N ×100 % ()3 1 1 2 20 1 1 2 2
2 期 高建芸等 : 最优子集回归在福建热带气旋年频数预测中的应用 51
f 0 () 2式中 E 为平均绝对误差 , X表示第次的预测值 , X表示第次预测相应的实际 i i
() ( 值 , N 为预测总次数 , 显然 E 越小越好 。3式中 R F 为预测效率 , N 为预测正确 指 0 0
) ( 预测与实况的绝对误差小于 015 个的次数 。N 和 f 分别为一级异常 指预测与实况的 1 1
)( 绝对误差大于等于 015 个且小于 115 个
文档评论(0)