基于网格的数据流聚类方法研究-计算机应用技术专业论文.docxVIP

基于网格的数据流聚类方法研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Classified Classified Index: U.D.C: ▲,。^ A Dissertation for the Degree of D.Eng Research of Data Stream Clustering Methods Based on Grid Candidate:Yu Xiang Supervisor:Prof.Yin Guisheng Academic Degree Appl ied for:Doctor of Engineering j Spec ial ty:Computer Appl i ed Technology Date of Submission:Apri l,2010 Date of 0ral Examination:June,2010 University:Harbin Engineering University ,s‘肉. , s ‘ 、 哈尔滨工程大学 哈尔滨工程大学 学位论文原创性声蹰 本人郑重声明:本论文的所有工作,是在导师的指导下,自 作者本人独立完成的。有关观点、方法、数据和文献IFI-I l用己在 文中指出,并与参考文献相对应。除文中己注明引用的内容外, 本论文不包含任何其他个人或集体己经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均己在文中以明确方式 标黾弓。本人完全惹识到本声明的法律结果由本人承担。 作者(签字):一一寸荔防 日期: 钞产年舌月,3曰 哈尔滨工程大学 学位论文授权使用声明 本人完全了解学校保护知识产权的有关规定,即研究生在校 攻读学位期间论文工作的知识产权属亍哈尔滨工程大学。哈尔滨 工程大学有权保留并向国家有关部门或机构送交论文的复印件。 本人允许哈尔滨工程大学将论文的部分或全部内容编入有关数据 库进行检索,可采用影印、缩印或扫描等复制手段保存和汇编本 学位论文,可以公布论文的全部内容。同时本人保证毕业后结合 学位论文研究课题再撰写的论文一律注明作者第一署名单位为哈 尔滨工程大学。涉密学位论文待解密后适用本声明。 本论文泛在授予学位后即可 口在授予学位12个月后 口 解密后)自哈尔滨工程大学送交有关部门进行保存、 作者(签享): 匀射 导师(签享) 邑期:矽少年多月哆吕 ≯扣年乡胃 飞 基于网格的数据流聚类方法研究摘 基于网格的数据流聚类方法研究 摘 要 近年来,数据采集技术以及数据挖掘技术不断发展,通常在短时间内就 ℃ 可以采集到大量的数据,并加以分析处理。随着信息技术以及Web技术的飞 速发展,数据不再是存储于可多次随机访问的介质中的静态数据,而是称之 0 为数据流的动态流式数据。不同于静态数据,数据流具有实时性、连续性、 顺序性等特性,因而传统的聚类分析技术无法直接应用于数据流,需要新的 聚类分析技术来处理数据流。本文针对数据流聚类技术从多个方面进行了深 入细致地研究。 首先,分析了基于网格的聚类算法的优缺点,进而对传统的静态网格划 分方法以及动态网格划分方法进行了研究,针对网格聚类算法中数据空间的 划分方法进行改进,拟对新的数据空间动态划分策略展开研究,使其可增量 地更新网格单元的结构以及统计信息。在此基础上,设计出基于动态网格划 分的聚类算法,使得新算法不仅具有传统网格聚类算法的高效性,且在一定 程度上提高聚类的质量。 其次,在新的数据空间动态划分策略的基础上,着重针对数据流的增量 聚类进行研究。对现有的数据流聚类算法和增量聚类算法的特性以及存在的 问题进行分析,针对数据流对聚类算法的实时性等方面的要求以及现有聚类 算法对非球形聚类效果不好的缺点,设计一种基于数据流的不规则网格增量 聚类算法。使得与其它算法相比,新算法具备传统网格聚类算法处理速度快 的优点,同时不断动态增量地调整网格整体结构。并充分利用网格聚类算法 的特点,通过判断网格是否相连,保证对于不同形状聚类的聚类效果。在网 格聚类时,无需预先指定聚类数目,且对孤立点有较好的鲁棒性。通常包含 孤立点的网格单元不会满足稠密度阈值的要求,可以通过剪枝策略进行去除 以减少算法复杂性。由于动态划分的网格单元反映了当前数据流的分布特点, 新算法应在一定程度上提高聚类的精度。 再次,在分析高维数据聚类方法和维度约简方法以及这两种方法在数据 哈尔滨T稃大学博十学位论文流环境中应用的基础上,针对高维空间数据稀疏性、数据属性重要度倾斜等 哈尔滨T稃大学博十学位论文 流环境中应用的基础上,针对高维空间数据稀疏性、数据属性重要度倾斜等 问题,对粗糙集理论进行研究,拟设计一种基于粗糙集属性约简的数据流增 量聚类算法。新算法应针对聚类的无监督特性通过改进后的无决策属性的属 性约简方法计算数据点各属性的重要度,并调整属性集。在属性集中增加具 有较高重要度属性的同时,淘汰属性集中

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档