基于层次的混合聚类算法分析-计算机应用技术专业论文.docxVIP

基于层次的混合聚类算法分析-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3.3.3 实验分析29 3.4 本章小结32 第四章 基于 BM-Chameleon 算法的混合聚类算法 33 4.1 划分聚类算法33 4.2 KBMC 混合聚类算法设计 35 4.2.1 混合算法的概述35 4.2.2 初始聚类中心的选取35 4.2.3 算法流程36 4.3 实验结果分析37 4.3.1 时间复杂度分析37 4.3.2 模拟数据38 4.3.3 实际数据39 4.4 本章小结41 第五章 总结与展望42 5.1 总结42 5.2 展望42 参考文献43 致 谢46 个人简历、攻读硕士学位期间发表录用论文47 IV PAGE PAGE 1 第一章 绪论 1.1 引言 在过去的几十年中,计算机软硬件稳定的、高速的发展导致了信息共享更为方便以及 数据收集途径更为广泛。这些都很大程度上刺激了信息技术和数据库技术的进步,进一步 促使丰富的数据信息被收集储存,用以完成信息搜索、数据分析等方面的工作。某种程度 上,数据就是企业最珍贵的财富。因此,人们急切地需要一种能够智能化地将大量数据转 化为有价值的信息的技术,以达到为人们提供决策服务的目的[1]。根据国际权威高德纳咨 询公司的调查分析报告显示,数据挖掘技术将是今后几年全世界范围内重点加大投资研究 的十大新兴高科技技术之一,它已经引起了学术界和工商界的重点关注,是当今数据库系 统开发、研究和应用领域的一个热点技术[2]。 目前的数据库系统能够很好地完成对数据的常规操作,但仍然无法挖掘出隐藏在数据 中的关系和规律,无法结合已有的信息来预测事物的发展方向。因为缺少发现隐藏在大量 数据内的知识的方法,造成了我们不得不面对数据量庞大但实用价值不足的难题。如何有 效的使用这些海量数据,成为解决这一难题的关键之处,同样也促使了数据挖掘技术的产 生和进步。数据挖掘技术涉及到多个学科,并着重探讨了发现隐含在大量数据中的知识的 可行性等问题,从数据中发现出来的知识可以应用在科学研究、决策支持、信息管理等 很多方面[3]。数据挖掘技术不仅满足对数据库的常规使用,更要完成对数据的多方向的分 析推理,以便寻求解决实际问题的方案,甚至还可以利用现有的数据来预测事件的未来发 展趋势。 数据挖掘是从大量数据中提取相关数据进行特定的形式变换,然后从中发现隐藏的、 有价值的、能被人们所熟知的信息的处理过程。数据挖掘大多与计算机科学有关,并通过 统计分析、在线分析处理(OLAP)、机器学习、专家系统以及模式识别等众多方法来实 现上述要求[5]。随着计算机通信技术的发展进步,各个行业都积累了大量数据信息,人们 HYPERLINK /view/16286.htm 力求对这些隐含了企业未来发展方向的数据信息进行智能化地分析,进行归纳性的整理, 帮助企业决策者调整市场策略,减少风险,做出正确的决策。数据挖掘是一个复杂的数据 处理过程,一般要经过数据选择阶段、预处理阶段、模式发现评估以及知识表示阶段等过 程[6]。基本上,在一个数据挖掘工程中真正使用数据挖掘算法进行数据处理的工作所用时 间并不多,任务目标的确定以及数据准备和预处理阶段占用了挖掘过程的大部分时间。 人们已经意识到数据挖掘技术给我们日常生活所带来的益处,更多的人参与到这一领 域的研究之中,使其越来越趋于成熟,在实际应用中也得到了长足发展,取得了一定得成 效,其中包括银行、保险、电信、气象、零售、工业生产等应用领域。数据挖掘技术正在 不断地被应用到新的技术领域,各种经典算法也不断地被加以改进,日益满足人们对数据 信息的需求,这都将更大程度上刺激数据挖掘技术的发展潜力,促进数据挖掘技术更好的 应用到人们的日常学习、生活和工作之中。但是数据挖掘技术在面对复杂的任务时选择合 理的方法会面临大量的挑战,针对日后数据形式的多样性,数据挖掘算法必须有更强的适 用性、可伸缩性。数据挖掘中如何减少噪声数据的影响、准确反映数据的真实情况、把挖 掘出来的知识以普通用户都能理解的形式展现出来,都是目前数据挖掘技术向前进步,满 足实际应用需求的重要问题。 聚类技术是数据挖掘领域中的一个重要分支,是科学研究以及应用领域的主要方法, 它以独立完成单一的数据挖掘任务,也可以当作其他方法的预处理过程。简单意义上的聚 类,就是把具有相似属性的数据归为一类,把不同属性的数据分别开来的过程[7]。所以, 聚类分析过程最关心的就是把有实际意义的数据集合理的划分为具有不同特征的组群,通 过发现这些群组之间的相似以及不同之处,得出有使用价值的结论。聚类技术在很多领域 都有广泛的应用,比如:生命科学、保险业、银行业、工程技术研究等[8]。 1.2 国内外研究现状 (1)数据挖掘技术的研究现状 数据挖掘技术是指从数据库中发掘用户感兴趣的信息的过程,该概念在 198

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档