改进聚类的索引建立方法研究.pdfVIP

下载本文档

5
0
约1.71万字
约 4页
2017-08-28 发布于湖北
举报
版权申诉

改进聚类的索引建立方法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

改进聚类的索引建立方法研究.pdf

106 2010，46(2) ComputerEngineeringandApplications计算机工程与应用 ◎数据库、信号与信息处理◎ 改进聚类的索引建立方法研究张泽宝，张健沛，杨静 ZHANG Ze—bao，ZHANG Jian-pei，rANG Jing 哈尔滨工程大学计算机科学与技术学院，哈尔滨 150001 SchoolofComputerScience and Technology，Harbin Engineering University，Harbin 150001China ， E—mail：zhangzebao@hrbeu．edu．cn ZHANG Ze—bao，ZHANG Jian—pei，YANG Jing．Index creating methodbased on improved clustering．ComputerEngineer— nigandApplications，2010．46(2)：106—108． Abstract：In the traditionalclusteringmethodsbased on grid and density，the intervaland the density valve needsto be input withunsmoothedcluster，wrongjudgementofclusteringboundary．A clusteringapproachisproposed，whichcanconfirm theinterval andthenumberofclustering，reasonableclustertheobjectandcreatetheHilbertR-treeusingtheresultofclustering．Experiment resultsshow thatthe method isbetterthan traditional HilbertR-treeindex in buildingtimeand otheraspects． Key words：clusteringanalysis；tree-likeindex； d partition；HilbertR—tree index 摘要：传统的基于网格与密度的聚类方法需要用户输入间隔距离和密度阀值参数，聚类的结果不平滑，不能很好地判断边界对象的网格归属。提出了一种自动根据对象的数量确定间隔的距离和聚类的数量的聚类方法，合理地将对象进行聚类划分，并将聚类的结果构建HilbertR—tree索引，通过实验表明算法在建立时间和其他性能上均优于传统的HilbertR—tree索引。关键词：聚类分析；树型索引；网格划分；HilbertR—tree索引 DOI：10．3778／j．issn．1002—8331．2010．02．033 文章编号：1002—8331(2010)02—0106—03 文献标识码：A 中图分类号：TP311 l 引言效地减少人为因素的控制，为空间索引的建立提供良好的聚类聚类分析主要是根据事物的特征对其进行聚类或分类，把结果，实验结果表明，该算法获得了很好的聚类结果，验证了该数据按照相似性归纳成若干类别，同一类中的数据彼此相似，算法的准确性和有效性。不同类中的数据差异大。聚类分析可以建立宏观的概念，发现数据的分布模式，以及可能的数据属性之间的相互关系。 2 基于网格和密度的算法聚类分析是数据挖掘中的—个重要的研究领域，其研究也典型的基于网格和密度的方法的主要思想是将数据空间深入到各个领域内并取得了很大的成就，众多专家和学者经过划分为若干单元的网格结构，根据每个单元的数据密度分布确研究提出了许多聚类算法，通常可分为划分方法、层次方法、基定密集程度，再将数据对象进行聚类，生成最终的聚类结果。此于密度方法、基于网格方法和基于模型方法。每种方法都有各方法能够发现子空间中的聚类簇，算法的效率很低，对数据输自的特性，其中基于网格和密度的CLIQUE算法在很多的性能