- 4
- 0
- 约6.52万字
- 约 80页
- 2019-03-28 发布于上海
- 举报
哈尔滨工程大学、
哈尔滨工程大学
、
瓴 学位论文原创性声明
弋;
本人郑重声明:本论文的所有工作,是在导师的指导下,由
作者本人独立完成的。有关观点、方法、数据和文献的引用已在 文中指出,并与参考文献相对应。除文中已注明引用的内容外, 本论文不包含任何其他个人或集体已经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。
作者(签字):丁釜』L
日期: 0 a『o 年乏月,f日
哈尔滨工程大学 学位论文授权使用声明
本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属于哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。
.本论文(囱在授予学位后即可 口在授予学位12个月后 口
解密后)由哈尔滨工程大学送交有关部
kk 作者(签字):了金J虱作者(签字):二f袋闼
^
日期: 。l。年弓月r日
’‘‘
’
‘‘ 摘 要
气
由于数据流快速、连续到达的大量数据使大多数的传统的聚类方法失效, 因此数据流领域里的数据挖掘中的聚类是一个难题。不能满足应用要求的传 统的数据聚类算法极大地制约着数据流的应用与发展。因此,研究和设计适 应数据流特点的聚类算法,具有很大的现实意义。
本文研究了传统聚类算法和数据流聚类算法,分析了各种算法的优点及 不足,在传统聚类算法、数据流核心技术和典型数据流聚类算法的基础上, 设计并实现基于网格与密度的数据流聚类算法GDCIu。该算法借鉴CluStream 算法的双层处理框架,将数据流聚类分为在线处理层和离线聚类层;在线处 理层快速读取数据流中到达的数据,将每一个数据点映射到对应的网格单元 和区域.形成相关的统计信息,并将其存储在作为概要数据结构的网格的特 征向量中。利用改进后的金字塔时间框架定时存储快照形式的概要信息,来 满足用户对历史数据流信息聚类和数据流演化分析的需求;离线层对在线层 所获得的概要信息进行精确聚类,是以网格单元的特征向量中的密度作为聚 类依据的。这两层处理框架的结合实现了数据流聚类的精确度和速度的折中。 为了提高聚类的质量,还将网格单元细分后构成的小区域作为聚类最小单位, 只要网格单元中有DENSE区域与聚类边缘的DENSE区域相邻,就将该网格 单元聚类到该类,为此本文提出了DENSE区域的相邻判断算法。以此来判 断聚类边缘的网格单元及相邻的网格单元中是否有相邻的DENSE区域存在, 更有效地支持GDCIu算法的实现。
实验结果表明GDClu算法可以发现任意数目、任意形状的聚类,还能有 效去除噪声数据,是一个具有应用前景的适用于流数据挖掘的聚类算法。
、
?。 关键词:数据挖掘;数据流:聚类算法;网格与密度
‘
哈尔滨丁稃火学硕+学位论文.1
哈尔滨丁稃火学硕+学位论文
.1
‘
Abstract
.I
The problem of the clustering of data mining is difficult in the context of data stream mining.This is because the large volumes of data arriving quickly and continuously in a stream render most traditional‘clustering algorithms too
inefficient.The traditional clustering algorithms that call not meet the application requirements greatly restdct the application and development of data streams. Therefore,the research on data stream clustering algorithms adapting to the characteristics of data streams has great practical significance.
Something about the traditional clustering algorithms and data stream
clustering algorithms are discussed in
您可能关注的文档
- 基于无线网络运动控制系统的研究-电工理论与新技术专业论文.docx
- 基于企业网络的产业集群技术创新扩散过程模式研究-技术经济及管理专业论文.docx
- 基于生育期模型的湖北中稻适宜播期与生产潜力的研究-气象学专业论文.docx
- 基于视频案例的师范生教学技能训练在线支持平台研究-教育技术学专业论文.docx
- 基于遗传—神经网络的电液伺服阀故障模式识别研究-机械设计及理论专业论文.docx
- 基于数据驱动的流程工业性能监控与故障诊断研究-控制科学与工程专业论文.docx
- 基于人力资本产权的企业经营者薪酬制度研究-会计学专业论文.docx
- 基于长江干线AIS的航运信息平台的开发与研究-交通信息工程及控制专业论文.docx
- 基于系统科学的高等教育转型发展研究-管理科学与工程专业论文.docx
- 基于可用性测试的培训类b2c网站设计研究-设计艺术学专业论文.docx
最近下载
- 学生退学家长知情同意书.docx VIP
- 计算机应用基础教程(Windows10+Office2016)PPT全套完整教学课件.pptx VIP
- 2024年江苏农牧科技职业学院高职单招职业技能测验历年参考题库(频考版)含答案解析.docx
- Unit 2 课时2 Section A (2a-2e) 教学设计-八年级英语上册.docx VIP
- 慢阻肺病标准化筛查问卷、Borg CR10 评分表.docx VIP
- 招标代理服务方案.docx VIP
- AD832I机台操作指引.pdf VIP
- 2019版《普速铁路线路修理规则》(可编辑修改word版).pdf VIP
- KK_Mixly_V3四轴飞行器教程——算法篇.docx VIP
- 河南大学研究生学位论文基本要求与书写格式的.docx VIP
原创力文档

文档评论(0)