数据挖掘中聚类法的研究.pdf

下载文档 降价啦

4
0
约4.43万字
约 44页
2016-01-01 发布于四川
举报
版权申诉
保障服务

数据挖掘中聚类法的研究.pdf

1、本文档共44页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

数据挖掘中聚类法的研究

摘要随着信息技术的迅速发展，人们积累了大量的数据。如何从这些冗余数据中提出对人们有用的信息就成了如今亟需要解决的问题。数据挖掘技术就在这种背景下应运而生，并且发展了几年就已经成为目前数据库和信息决策领域最为热门的课题和方向之一。作为数据挖掘中的一个重要分支，聚类分析是通过分析数据的相似性把大型数据集合分类，使得在同一个类里面的数据最为相似，而不同类中的数据又彼此相异，得到很好的分类效果。本文主要研究了聚类算法，所做的主要工作如下： 1．利用密度聚类算法收敛速度快，层次聚类算法可以在不同粒度水平上对数据进行探测，而且容易实现相似度量或距离度量的优点，发现了一种新的基于密度的层次聚类算法，克服了层次聚类算法时间复杂度的问题，得到比较好的聚类结果。 2．将免疫算法引入模糊聚类算法，克服了模糊聚类算法对初始值敏感容易陷入局部最优的问题。新的聚类算法能够在不给定初始簇数目的条件下得到准确的聚类结果。 3．结合传统聚类算法与模糊聚类算法。利用密度算法对中心点不敏感的优点，将密度算法应用于模糊聚类，得到新的聚类算法应用于数据量大的数据集时，它的准确率要明显高于模糊聚类算法和免疫算法。关键词：聚类算法；C均值算法；密度聚类算法；层次聚类算法；免疫算法；自适应聚类算法。 ABSTRACT Withthe of informationscienceand database development technology,themanagement havebeen moreandmore thesizeof has system applied widely,andthedatabasecontinuedto haveaccumulatedmassiveamount ofbusiness howtofindthe expand，people data,and valuableinformationinthevastocean—like datahavebecomean needtobesolved． urgent Fromthisdata have isoneofthemost miningtechniques emerged，which cutting-edge research ofthedatabaseandinformation asan decision—making．Clusteranalysisimportant branch ofdata isthe ofdata’S dividedthe datasetsinto mininganalysis similarity,and large whichthe datainsidethesame wasmostsimilartoeachother in groups，in group andthedata differentwas differfromeach isaneff