基于网格与密度的数据流聚类算法研究-计算机应用技术专业论文.docxVIP

  • 4
  • 0
  • 约6.52万字
  • 约 80页
  • 2019-03-28 发布于上海
  • 举报

基于网格与密度的数据流聚类算法研究-计算机应用技术专业论文.docx

哈尔滨工程大学、 哈尔滨工程大学 、 瓴 学位论文原创性声明 弋; 本人郑重声明:本论文的所有工作,是在导师的指导下,由 作者本人独立完成的。有关观点、方法、数据和文献的引用已在 文中指出,并与参考文献相对应。除文中已注明引用的内容外, 本论文不包含任何其他个人或集体已经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 作者(签字):丁釜』L 日期: 0 a『o 年乏月,f日 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 .本论文(囱在授予学位后即可 口在授予学位12个月后 口 解密后)由哈尔滨工程大学送交有关部 kk 作者(签字):了金J虱作者(签字):二f袋闼 ^ 日期: 。l。年弓月r日 ’‘‘ ’ ‘‘ 摘 要 气 由于数据流快速、连续到达的大量数据使大多数的传统的聚类方法失效, 因此数据流领域里的数据挖掘中的聚类是一个难题。不能满足应用要求的传 统的数据聚类算法极大地制约着数据流的应用与发展。因此,研究和设计适 应数据流特点的聚类算法,具有很大的现实意义。 本文研究了传统聚类算法和数据流聚类算法,分析了各种算法的优点及 不足,在传统聚类算法、数据流核心技术和典型数据流聚类算法的基础上, 设计并实现基于网格与密度的数据流聚类算法GDCIu。该算法借鉴CluStream 算法的双层处理框架,将数据流聚类分为在线处理层和离线聚类层;在线处 理层快速读取数据流中到达的数据,将每一个数据点映射到对应的网格单元 和区域.形成相关的统计信息,并将其存储在作为概要数据结构的网格的特 征向量中。利用改进后的金字塔时间框架定时存储快照形式的概要信息,来 满足用户对历史数据流信息聚类和数据流演化分析的需求;离线层对在线层 所获得的概要信息进行精确聚类,是以网格单元的特征向量中的密度作为聚 类依据的。这两层处理框架的结合实现了数据流聚类的精确度和速度的折中。 为了提高聚类的质量,还将网格单元细分后构成的小区域作为聚类最小单位, 只要网格单元中有DENSE区域与聚类边缘的DENSE区域相邻,就将该网格 单元聚类到该类,为此本文提出了DENSE区域的相邻判断算法。以此来判 断聚类边缘的网格单元及相邻的网格单元中是否有相邻的DENSE区域存在, 更有效地支持GDCIu算法的实现。 实验结果表明GDClu算法可以发现任意数目、任意形状的聚类,还能有 效去除噪声数据,是一个具有应用前景的适用于流数据挖掘的聚类算法。 、 ?。 关键词:数据挖掘;数据流:聚类算法;网格与密度 ‘ 哈尔滨丁稃火学硕+学位论文.1 哈尔滨丁稃火学硕+学位论文 .1 ‘ Abstract .I The problem of the clustering of data mining is difficult in the context of data stream mining.This is because the large volumes of data arriving quickly and continuously in a stream render most traditional‘clustering algorithms too inefficient.The traditional clustering algorithms that call not meet the application requirements greatly restdct the application and development of data streams. Therefore,the research on data stream clustering algorithms adapting to the characteristics of data streams has great practical significance. Something about the traditional clustering algorithms and data stream clustering algorithms are discussed in

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档