网站大量收购独家精品文档,联系QQ:2885784924

基于模糊聚类的高维划分策略研究.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模糊聚类的高维划分策略研究.pdf

第28卷 第1期 武汉理工大学学报 -信息与管理工程版 V01.28No.1 2o06年 1月 JOURNAL0FWUT(INFORMATION&MANAGEMENTENGINEERING Jan.2006 文章编号:1007—144X(2006)01—0007—04 基于模糊聚类的高维划分策略研究 蔡 月 ,徐王伟 (1.武汉理l_l_大学信息_l_程学院,湖北 武汉430070;2.南京航空航天大学经济管理学院,江苏南京 210018) 摘 要:数据集的划分策略是影响高维数据库索引性能的一个关键因素。金字塔技术是一种较好的高维索引 方法,但它只对均匀分布的数据集具有良好的性能。为此 ,提出了一种改进的基于模糊聚类的金字塔技术 ,并 将其用于高维划分策略,先对数据集进行模糊聚类处理 ,然后针对每个聚类进行金字塔划分 ,从而较好地实现 了对非均匀分布数据的高维划分。 关键词 :模糊聚类 ;高维;划分策略 中图法分类号:TP39 文献标识码:A 2.1 金字塔技术 1 引 言 金字塔技术 的基本思想是将 d维数据空 伴随着多媒体数据库技术、GIS技术 以及 间分割维2d个金字塔的集合 (这些金字塔均以 DNA数据库技术的发展,对高维数据库的研究越 数据空间的中心为顶点),再把每个金字塔都划 来越重要。此外,由于数据的大容量,甚至是海量 分为平行于其底边 (平面)的若干面片。划分完 的特性也 日趋明显,就迫切要求通过有效的索引 毕之后,提供从d维数据点到 1维金字塔值的一 机制来实现对高维空间中大容量数据的查询处 个映射,这些 1维的值则可以通过 1维的索引结 理,而高维数据库索引的关键则是在于对高维数 构B+树进行存储和访问。 据集的划分。 以2维空间为例,数据空间先被分割成4个 高维数据集的典型划分策略有R树及其变 金字塔 (三角形),这些三角形具有共同的顶点 体、x一树、kd一树、TV—tree、SS—tree、SR树、ER (0.5,0.5)。然后对每个三角形平行于其底边进 一 树、VA—fi1e、金字塔技术和Bitmap技术…等。 行分割,如图1所示。 在这些划分机制中,除了金字塔技术的性能不受 6t一1)维平而 数据维数的影响,其他各种机制的最大问题都在 于其性能会随着数据维数的增高而急剧降低。 笔者在充分利用金字塔技术不受数据维数影 / 响这一优点的基础上,通过使用模糊聚类方法,弥 补了该技术只适用于均匀分布的数据的缺陷,从 / \ / \ 而提出了一种基于模糊聚类的金字塔划分策略。 数据空问 图1 数据空问的金字塔划分 2 基于模糊聚类的金字塔划分算法设计 笔者从这一点人手,将模糊聚类技术与金字 度 塔技术结合起来,设计提出了一个合适的、适用于 不规则数据集的聚类算法,并将其作为金字塔划 分的预处理。该划分策略大致分为2个步骤,先 金7塔r“ 是对数据集进行模糊聚类 ,然后对各个聚类分别 图2 金字塔空间中数据点的属性 采用金字塔技术进行划分。因此,模糊聚类方法 的

文档评论(0)

ziyouzizai + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档