- 1、本文档共37页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于K-means算法的平面点集聚类系统
基于K-means算法的平面点集聚类系统
院 系 北方软件学院 专 业 计算机科学与技术(软件工程) 班 级 学 号 姓 名 指导教师 负责教师
沈阳航空航天大学
2011年6月摘 要
聚类是数据挖掘领域中重要的技术之一,用于发现数据中未知的分类。聚类分析已经有了很长的研究历史,其重要性已经越来越受到人们的肯定。聚类算法是机器学习、数据挖掘和模式识别等研究方向的重要研究内容之一,在识别数据对象的内在关系方面,具有极其重要的作用。聚类主要应用于模式识别中的语音识别、字符识别等,机器学习中的聚类算法应用于图像分割,图像处理中,主要用于数据压缩、信息检索。聚类的另一个主要应用是数据挖掘、时空数据库应用、序列和异常数据分析等。此外,聚类还应用于统计科学,同时,在生物学、地质学、地理学以及市场营销等方面也有着重要的作用。
本文是对聚类算法K-means的研究。首先介绍了聚类技术的相关概念。其次重点对K-means算法进行了分析研究,K-means算法是一种基于划分的方法,该算法的优点是简单易行,时间复杂度为O(n),并且适用于处理大规模数据。本系统主要是对其进行算法和界面实现。
关键词:数据挖掘;聚类分析;K-means
Abstract
Clustering is one of the most important technologies of data mining, which is used to discover unknown classification in data set. As it has a long history of research,the importance of clustering is affirmed by people. Clustering algorithms is one of the most important algorithms which is researched extensively in machine learning, data mining and pattern recognition. It has important effect on identify intra-connection between objects. Clustering is applied in sound recognition, character recognition of pattern recognition and so on. Clustering algorithms in machine learning are applied in image segmentation and image processing which can be used to deal with data compression and information search. Another important application is applied in data mining, space database, sequence and anomaly data analysis and other fields such as statistic, biology, geognosy, geography and market.
This paper is about the research of K-means. At first,some related concepts of clustering are given. The chief point of the paper is the research on K-means. K-means, O(n) time complexity, is a partition method that it is easy to use and can work well with large data set. The system is to achieve its algorithm and interface.
Keywords: Data Mining; Clustering Analysis; K-means
目 录
1绪论 1
1.1研究意义及背景 1
1.2系统设计要求 2
1.3本文目的 3
2研究现状及设计目标 4
2.1国内外相关研究现状 4
2.2现行研究存在的问题及解决办法 5
2.2.1K-means的基本思想 6
2.2.2K-means的优点 6
2.2.3聚类分析中常用的距离计算函数 6
2.2.4聚类方法分析 7
2.
您可能关注的文档
- 基于BIOS的嵌入式系统数据通讯开发.doc
- 基于AVR和SG3525的数控开关电源设计.doc
- 基于ATS89C52单片机的多功能智能小车设计.doc
- 基于BS模型的个人住房贷款系统设计与实现.doc
- 基于BS架构的火车站自助服务系统.doc
- 基于BS模式的网上调查系统的设计和实现.doc
- 基于BS模式的网上购物系统的研究与开发.doc
- 基于BS的教学信息管理系统.doc
- 基于BS的大学网上教学系统的设计与实现.doc
- 基于BS结构的水电费网上查询系统开发和设计.doc
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
文档评论(0)