- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于模糊聚类的高维划分策略研究.pdf
第28卷 第1期 武汉理工大学学报 -信息与管理工程版 V01.28No.1
2o06年 1月 JOURNAL0FWUT(INFORMATION&MANAGEMENTENGINEERING Jan.2006
文章编号:1007—144X(2006)01—0007—04
基于模糊聚类的高维划分策略研究
蔡 月 ,徐王伟
(1.武汉理l_l_大学信息_l_程学院,湖北 武汉430070;2.南京航空航天大学经济管理学院,江苏南京 210018)
摘 要:数据集的划分策略是影响高维数据库索引性能的一个关键因素。金字塔技术是一种较好的高维索引
方法,但它只对均匀分布的数据集具有良好的性能。为此 ,提出了一种改进的基于模糊聚类的金字塔技术 ,并
将其用于高维划分策略,先对数据集进行模糊聚类处理 ,然后针对每个聚类进行金字塔划分 ,从而较好地实现
了对非均匀分布数据的高维划分。
关键词 :模糊聚类 ;高维;划分策略
中图法分类号:TP39 文献标识码:A
2.1 金字塔技术
1 引 言
金字塔技术 的基本思想是将 d维数据空
伴随着多媒体数据库技术、GIS技术 以及 间分割维2d个金字塔的集合 (这些金字塔均以
DNA数据库技术的发展,对高维数据库的研究越 数据空间的中心为顶点),再把每个金字塔都划
来越重要。此外,由于数据的大容量,甚至是海量 分为平行于其底边 (平面)的若干面片。划分完
的特性也 日趋明显,就迫切要求通过有效的索引 毕之后,提供从d维数据点到 1维金字塔值的一
机制来实现对高维空间中大容量数据的查询处 个映射,这些 1维的值则可以通过 1维的索引结
理,而高维数据库索引的关键则是在于对高维数 构B+树进行存储和访问。
据集的划分。 以2维空间为例,数据空间先被分割成4个
高维数据集的典型划分策略有R树及其变 金字塔 (三角形),这些三角形具有共同的顶点
体、x一树、kd一树、TV—tree、SS—tree、SR树、ER (0.5,0.5)。然后对每个三角形平行于其底边进
一 树、VA—fi1e、金字塔技术和Bitmap技术…等。 行分割,如图1所示。
在这些划分机制中,除了金字塔技术的性能不受
6t一1)维平而
数据维数的影响,其他各种机制的最大问题都在
于其性能会随着数据维数的增高而急剧降低。
笔者在充分利用金字塔技术不受数据维数影 /
响这一优点的基础上,通过使用模糊聚类方法,弥
补了该技术只适用于均匀分布的数据的缺陷,从 / \ / \
而提出了一种基于模糊聚类的金字塔划分策略。 数据空问
图1 数据空问的金字塔划分
2 基于模糊聚类的金字塔划分算法设计
笔者从这一点人手,将模糊聚类技术与金字 度
塔技术结合起来,设计提出了一个合适的、适用于
不规则数据集的聚类算法,并将其作为金字塔划
分的预处理。该划分策略大致分为2个步骤,先 金7塔r“
是对数据集进行模糊聚类 ,然后对各个聚类分别
图2 金字塔空间中数据点的属性
采用金字塔技术进行划分。因此,模糊聚类方法
的
您可能关注的文档
- 基于Web+Service的地图符号库的设计与实现.pdf
- 基于WebMVC系统架构实现的用户注册.doc
- 基于webservice的系统交互设计与实现.pdf
- 基于Web服务的行业供应链集成系统研究.pdf
- 基于Web的教师调停课系统管理分析与设计.doc
- 基于Web的物流园区信息平台的构建.pdf
- 基于WEB的远程教学系统的设计与实现.pdf
- 基于WIKI的群体知识共享与创新服务研究_焦玉英.pdf
- 基于WiMAX的紧急呼叫系统研究.pdf
- 基于WordNet和二分图的语义Web服务发现算法.pdf
- 2025年制造业数据治理在智能仓储管理中的应用与优化报告.docx
- 2025年食品工业化生产技术改造与政策支持研究报告.docx
- 生鲜新零售行业供应链优化与冷链物流企业市场拓展战略实施路径研究实施报告.docx
- 农业灌溉用水高效利用2025年农业节水灌溉技术标准与规范应用动态与挑战动态分析报告.docx
- 电商绿色物流发展现状与绿色物流产业政策效应评估报告2025年.docx
- 智能交通系统在高速公路2025年智能交通系统安全风险管理.docx
- 2025年新能源汽车充电站布局与充电技术市场调研报告.docx
- 2025年农产品冷链物流行业冷链物流技术创新与应用趋势报告.docx
- 2025年银行零售业务数字化营销转型:金融科技与网络安全研究报告.docx
- 2025年医药电商平台运营与合规管理创新案例分析.docx
文档评论(0)