基于哈夫曼树的雷电数据采样算法.pdfVIP

  • 7
  • 0
  • 约1.72万字
  • 约 5页
  • 2017-10-27 发布于北京
  • 举报
基于哈夫曼树的雷电数据采样算法.pdf

第39卷第5期 计算机工程 2013年5月 2013 、,01.39 NO.5 ComputerEngineering May 文麓标识码:A ·人工智能及识别技术· 文章■号{l帅o_-3428(2013)05__0174__04中田分类号:TP301.6 基于哈夫曼树的雷电数据采样算法 彭永供,邱桃荣,林子渊,黄海泉 (南昌大学信息工程学院,南昌330031) 摘要:对具有非平衡特征的海量雷电气象数据集,采用基于欧式距离的样本欠采样算法时效率较低。为解决该问题,提 出一种基于哈夫曼树的雷电数据采样算法。使用哈夫曼树构建方法估算雷电样本的簇中心及簇内样本个数,利用得到的结 果并结合欧式距离的样本欠采样算法进行非雷电样本采样。对27552条真实数据做采样实验,结果表明,该算法的采样时 间约为16min,不仅能降低数据量,而且能提高算法的时间性能。 关键词:雷电预报;非平衡数据;欠采样算法;哈夫曼树;支持向量机 Data Based0nHuffmanTree LightningSamplingAlgorithm PENG Yong-gong,QIUTao-rong,LINYu-yuan,HUANGHai-quan ofInformation 33003 (School 1,China) Engineering,NanchangUniversity,Nanchang in ordertosolve ofbad ofa basedonEuclideandistancea [Abstract]In the problemperformancesamplingalgorithm large datasetwithanimbalanced a data basedonthe characteristics,this lightningsamplingalgorithm meteorological paperproposes Huffman ofclustercentersandthenumberofthe ofeachclusteris tree.An to calculatethenumber approachquickly samples the for Huffman totwovalues canbeusedto designed tree.According attained,thisalgorithm generate byusingtechniquebuilding onthe setwith27552 show

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档