- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
98 and
2009。45C号=flJ) ComputerEngineeringApplications计算机工程与应用
K—Means聚类在气象数据分析中的应用
黄静华L2,刘小魏,,袁玫z,马楠z
1.中国矿业大学(北京)机电与信息工程学院,北京100083
00101
2.北京联合大学信息学院,北京1
3.国家气象中心预报系统实验室,北京100081
E-raail:xxtjinghua@buu.edu.cn
摘要:利用k-means算法,在气象台站历史数据基础上进行聚类研究,通过缺失值处理和数据归一化处理,修正属性对聚类算法
的权重影响。探讨了选择初始聚类核的方法,以及聚类的相异度计算的实现策略。实验表明,k-means算法在气象分析中具有较好
的聚类效果。
关键词-k-Inefl.n8算法;聚类;气象资料
文献标识码:A 中图分类号:TP311.52;TP274
1前言 ●
y=∑∑(薯啦)2 (2)
。
由于大气运动非常复杂,大大小小的天气系统相互联系、 i=I‘ES
相互制约,天气系统的形成变化又与地理环境相互影响,故天 Si分别表示k个类集合i=1,2,…,k。胁是类S的平均值,≈∈
气预报决策比较困难,预报水平不高。但是,大气在瞬息万变中 sj代表.s。中的每—个对象。
又存在诸多规律,尤其是某个天气现象的出现与一些气象要素 似均值即是类Si中所有数据的平均值,假设Si中有tit个
的变化有极大关联。要找到这些规律,就必须从大量的历史气 数据,暂∈5lJ=l,2,…,m,则均值定义如式(3)所示:
象要素数据库入手,从中分析挖掘出有预报价值、可应用于预
报决策的东西。
天气是指某地区各种气象要素在一定时期内的综合体现, 胪 ∑丝m丐一 (3)
因为天气受多因素影响,包括地形、地理位置等综合作用,所以 将偏离均值达3倍标准差的数据以偏值的方式表示,偏值
在不同地域可能有近似的天气现象。以往在考虑地区天气差异 对距离的影响较大,直接影响到聚类结果。标准差盯指统计上
时,更多的是按照地理位置,或者按降雨量聚类,很难将多因素 用于衡量一组数值中某一数值与其平均值差异程度的指标,定
综合考虑。数据仓库中沿某个维度上钻,也可理解为按某个维 义如式(4):
度进行聚类的一种实现,但只是参照了—个维度的信息进行汇
总,没有考虑所有因素的综合作用。该文探讨采用k-means聚
(4)
类算法,将地面天气因素综合考虑,发现全局的分布模式,以及 刮挲
数据属性之间的有趣的相互关系,同时可作为其他气象信息挖
掘的预处理步骤。 流程如下:
输入:簇的数目k和包含n个对象的数据集。
2 k—means聚类算法 输出:k个簇,使方差最小。
聚类是将数据对象分组成为多个类或簇,在同一个簇中的 (1)任意选择k个对象作为初始的簇中心;
对象之间具有较高的相似度,而不同簇中的对象差别较大。k—
(2)repeat
means算法以k为参数,把凡个对象分为k个簇,以使类内具 (3)根据与每个中心的距离,将每个对象赋给“最近”的簇;
有较高的相似度,而类间的相似度最低。相似度的计算根据一
您可能关注的文档
最近下载
- 【交通运输类】浙江省汽车维修行业工时定额和收费标准浙江省交通厅浙江省物价局精编.pdf VIP
- TD-JZ2006-6001西南设计院预埋件图集.pdf
- 01J925 1 压型板屋面.PDF VIP
- 视听语言 镜头运动.pptx VIP
- 广州市白云区广大附中实验中学2022-2023学年上学期期中调研八年级物理问卷.docx VIP
- JB∕T 5317-2016 环链电动葫芦.pdf VIP
- 广东省广州市白云区广大附中实验中学2022-2023学年八年级上学期期末线上考试语文试卷.doc VIP
- 风电机组专项隐患排查治理记录表.doc VIP
- 风电机组专项隐患排查治理记录表自查.pdf VIP
- 工厂生产管理制度(3篇).docx VIP
文档评论(0)