数据挖掘中聚类算法的应用设计.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘中聚类算法的应用设计

吉林电子信息职业技术学院 毕业论文(设计) 题 目:数据挖掘中聚类算法的应用设计 系 部: 机电技术学院 专业班级: 12级机电17班 指导教师: 高岩 姓 名: 王增亮 摘 要 聚类分析是数据挖掘中的一个主要研究方向,目前已经深入到各个领域并取得了很好的进步。本文将从数据挖掘入手,详细探讨聚类算法在数据挖掘的发展过程中所起的作用,并对聚类算法在各个时期的理论和应用作相应分析。最后,我们将对聚类的K-Means算法进行实例操作,分析聚类算法存在的问题和一些解决方案。希望能总结对过去成果并对今后发展方向起到引导作用。 关键词: 信息;数据挖掘;聚类分析;K-Means算法 Abstract The analyse of clustering is a major part in the data mining,which have already been applied into several domains and earned a large advancement . In the paper ,we will give a detailed discuss with the function of clustering algorithm acted on the developing of data mining , starting with the introduction of data mining , and give a analysis on the theoretics and appiciation of the cluster algorithm in different phases. At last, we will validate the K-Means algorihm of clusering , analyse the problem existed in the algorithm and give some methods to reslove them through a given example . These maybe summarize the achievement and channel off the developing of data mining. KeyWords: Information; Data Mining; The Analyse of Clustering; The algorithm 目 录 摘 要 I Abstract II 目 录 III 引 言 1 第1章 聚类分析基本概念与算法 2 1.1 聚类分析 2 1.2 常见数据类型和距离公式 2 1.3 聚类的一般步骤 4 1.4 划分聚类 4 1.5 层次聚类 5 第2章 新发展的聚类算法 7 2.1 基于模糊的聚类方法 7 2.2 量子聚类 8 2.3 核聚类 8 2.4 谱聚类 9 第3章 程序调试 10 3.1 原理描述 10 3.2 数据的引入和处理 11 3.3 实验操作过程 13 结束语 20 参考文献 21 引 言 当我们步入二十一世纪时,信息产业在全世界范围内以信息的几何增长的速率快速发展起来。对各个领域和企业部门来说,增强对数据中信息价值的利用可以引导其在激烈的竞争环境中快速发展并力求胜出。在推行电子政务的今天,政府部门的数据也在进行数字化。科研机构更是收集了大量的科学研究数据,试图从中发现自然界和社会及经济运转的秘密。这些都是我们解读数字信息所需面临的一些新的挑战。比如,根据对客户销售关系的研究,我们可以知道,一个好的行为描述经常也是对行为本身的一种解释,至少提示从哪里寻找解释。这种解释通常来自我们对业务范围内的相关销售份额及客户和市场信息,所以要求我们通过不同模式进行“创意”分析,寻找利润的最大支撑点。 信息是由数据所表达的客观事实,而知识是信息经过智能性加工过后的产物。目前虽然能实现高效的数据录入、查询、统计、输出和积累等功能,但是却随之出现一个问题,大量的数据相对降低了人们分析数据的能力,使发现大数据集中数据间关联规则更加困难,从而对根据数据预测趋势的能力得不到保障。出现了“数据丰富而信息贫乏”的现象。数据挖掘的目的就是帮助决策者寻找数据间潜在的知识,对决策者在现

您可能关注的文档

文档评论(0)

yaobanwd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档