气象数据概化中的最佳聚类数研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
气象数据概化中的最佳聚类数研究.pdf

第42卷第3期 华中师范大学学报(自然科学版) V01.42No.3 HUAZH()NGNORMAI。UNIVERSITY(Nat.Sei.) 2008年9月 JOURNAI。OF Sept.2008 文章编号:1000—1190(2008)03—0490—05 气象数据概化中的最佳聚类数研究 赵 超1,舒 红¨,朱欣焰1,戴上平2 (1.武汉大学测绘遥感信息工程国家重点实验摩,武汉430079} 2.华中师范大学计算机科学系,武汉430079) 摘要:以黑龙江省中部地区2004年的气温和降水观测数据为实例,对数据挖掘中气象数据 的概化问题进行研究.调查分析了概化方法和数据特征,确定采用模糊C均值聚类算法.重点 研究了算法中最佳聚类数的确定,选取多种广泛认可的指标,对聚类结果进行有效性对比分 析,采用综合最优的聚类数为最佳聚类数.研究发现这种方法聚类结果合理且具有较强的可 拓展性. 关键词:模糊聚类;气象数据;FCM}最佳聚类数 中图分类号:P40 文献标识码:A 一般地说,气象数据是连续性的属性数据,需 1数据准备 要按照一定的规则将其离散化,将具体的数值转化 为概念,才能利用计算机进一步发现知识[1].这一 本文的研究区域是黑龙江省中部地区,实验数 过程即为数据概化,可采用两种方法:一是分类,即 据为研究区域内23个气象站点的气温和降水观测 专家干预,利用专家的知识、经验完成连续性属性 数据.气象数据来源于中国气象数据共享网,观测 数据离散化过程;二是聚类,即用数学方法定量的 站点及其分布情况如图1所示.所选择研究区域范 确定样品间的亲疏关系,按其亲疏程度自然、客观 围小,气候成分单一,以便于与聚类结果验证,从而 地分型划类,最后能得到一个反映个体间亲疏关系 客观的评价聚类方法. 的类别集合[23.本质上,数据挖掘中应尽量减少人 为干预,因此采用聚类分析更合理.模糊聚类引入 了模糊逻辑的概念,每个样本点都是一定程度的属 于某个类,也可以同时以不同的程度属于几个 类[3].连续性属性数据是对渐变过程的取样,采用 这种软分类的方法进行聚类,其结果更符合客观情 况.模糊C均值FCM(FuzzyC—Means)算法是在传 统C均值算法中应用了模糊技术,不需要过多的人 工干预且具有较好的效果¨].但FCM算法需要人 为给定聚类数,聚类数合理与否对聚类结果有着重 要影响.关于这方面的研究,孙才志[8]引入了数理 图1 研究区域及气象站分布 统计中的统计量,诸克军[93等构造了新的指标,用 areaandweatherstation Fig.1Thestudy 来衡量聚类结果的有效性以确定出合理的聚类数, 但方法复杂,不易解释.本文综合采用多种广泛认 2研究方法 可的指标,结果证明可有效地确定气象数据最佳聚 2.1标准化处理 类数,聚类结果合理,公式意义明确,方法易行且具 数据标准化处理主要包括数据同趋化处理和 有一定的可拓展性. 收稿日期:2008—06—10. *通讯联系人.E—mail:hshucn@yahoo.corn.en 万方数据 第3期 赵 舒等

文档评论(0)

文档精品 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档