空间数据挖掘中的聚类分析研究-系统工程专业毕业论文.docxVIP

  • 6
  • 0
  • 约6.6万字
  • 约 87页
  • 2019-05-14 发布于上海
  • 举报

空间数据挖掘中的聚类分析研究-系统工程专业毕业论文.docx

西安建筑科技大学硕士论文 西安建筑科技大学硕士论文 西安建筑科技大学硕士论文 西安建筑科技大学硕士论文 空间数据挖掘中的聚类分析研究 专 业: 系统工程 硕士生: 胡红光 指导教师:刘培奇 教授 摘 要 随着信息技术和数据获取技术的发展,研究人员收集并保存了大量的与空间位 置有关的历史数据。针对这些庞大的数据,人们迫切希望找到强有力的数据分析 工具来挖掘空间数据中隐含的知识。空间聚类分析是强有力的数据分析工具之一, 空间聚类分析可以发现隐藏在数据海洋中的聚类规则,又可与其他类型的数据挖 掘问题结合,挖掘出更深层的知识。 本文主要研究工作如下: 1.研究了聚类分析的基本理论,传统的和新近提出的空间聚类分析算法。 2.针对队列智能聚类算法的局部收敛和停滞问题,采用层次聚类算法对其解进 行聚类,提高种群多样性从而提升聚类的质量。采用 UCI 机器学习库中的 IRIS、 CMC 和 Wine 数据集进行测试,改进算法的 F 值(聚类准确率)优于 k-means、 k-medoid,表明改进算法聚类效果优良。 3.针对模糊 k-modes 聚类隶属度测度方法没有考虑对象空间分布的缺陷,将距 离和密度双度量的测度方法引入模糊 k-modes 算法,从而以一种更加合理的方式 更新对象的隶属度。采用 UCI 机器学习库中的 vote、mushroom 和 zoo 数据集进行 测试,改进后算法的 F 值优于改进前的,表明改进算法聚类效果优良。最后将改 进后的算法用于百度地图中收集来的空间数据进行聚类,得到了较好的聚类结果, 表明了算法应用于空间数据的可行性和有效性。 4.最后,论文采用包含经纬度信息的芬兰两城市移动电话 GPS 数据和上海公交 车和的士的追踪 GPS 数据,用基于动态聚类的队列智能算法进行聚类分析,芬兰 两城市的移动电话 GPS 数据聚类结果可以帮助当地移动运营商决策移动基站的放 置位置;上海公交车的追踪 GPS 数据聚类结果可以帮助公交公司决策调度站的放 置位置;的士 GPS 数据聚类结果可以帮助出租车公司决策分公司的位置。 本文对队列智能算法和模糊 k-modes 进行改进,通过实验,聚类结果良好,并 将改进后的队列智能算法应用于实际的空间数据挖掘问题中,解决了具有实际意 义的空间数据挖掘问题。 关键词:空间聚类分析,队列智能,层次聚类,K-modes,模糊聚类 Research on Clustering Analysis in Spatial Date Mining Specialty:Systems Engineering Name: Hu Hongguang Instructor:Prof.Liu Peiqi ABSTRACT With the development of information technology and data acquisition technology, the massive history data which are related to spatial position is collected and maintained by researchers. In view of these huge data, people urgently hope to find out a powerful data analysis tool to seek the knowledge which is hidden in spatial data. Spatial clustering analysis is one of the powerful data analysis tools, it not only can find clustering rule that is hidden in the ocean of data, but also can be combined with other kinds of data mining problems to dig out the deeper level of knowledge. The major research contents of this paper are as follows: This paper research the basic theory of clustering analysis, traditional and the new proposed the spatial clustering analysis algorithms. Due to the local convergence and stagnation of queue intelligent clustering

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档