- 0
- 0
- 约4.2千字
- 约 7页
- 2016-09-10 发布于北京
- 举报
一种二阶段法处理考虑约束的空间聚类问题.doc
一种二阶段法处理考虑约束的空间聚类问题
【摘要】如何在海量的、复杂的空间数据中进行聚类,而往往要考虑空间实体间约束条件的存在,又要求聚类结果的不失真,提高聚类的质量,这些是空间聚类中必然面临的挑战。在对空间聚类的研究基础上,提出一种二阶段聚类法,对空间属性和非空间属性分别进行处理,首先在非空间属性空间中进行无约束的一次聚类,而后在空间维中进行考虑实体约束的基于网格的聚类。算法一方面保持基于网格的聚类对海量数据聚类的高效性,另一方面又考虑了空间实体约束,以提高聚类的质量。
【关键词】实体约束;格网;空间聚类
1.引言
作为空间数据挖掘的一个重要分支,空间聚类,是根据某种距离或相似性准则对空间实体集进行自动分组,达到组内差异最小、组间差异最大的过程[1]。空间聚类的特征在于空间数据本身的特性(高维、多尺度、海量)及空间对象之间的复杂关系(空间拓扑关系、方位关系、度量关系),在复杂的空间对象间往往会存在诸多限制条件,如某些空间实体的存在改变了聚类对象的分布和彼此间的距离。这种限制条件称为约束条件,考虑了约束条件的空间聚类称为约束空间聚类。若忽略了约束条件,得到的聚类结果会不符合实际,或者是对实际的一种扭曲[2]。本文提出的二阶段聚类法中,第一阶段是在非空间属性空间中采用适当的方法进行聚类,并把得到的结果作为第二阶段在空间属性空间中的聚类对象,其中采用基于格网的方法,把聚类对象和约束对象映射到格网中进行聚类,而后可采用边界处理技术提取簇的边界点,以得到最终聚类结果。在第一步聚类中,可以采用适当的、传统的非约束的聚类方法,而第二步为本文提出考虑约束的基于网格的空间聚类,并作详细介绍。本文考虑二维空间实体约束(包括障碍约束和便利约束)进行研究,提出一种基于空间实体约束的格网空间聚类算法,以下章节的安排是第2部分空间约束的处理,第3部分对TPSCBGC算法进行描述分析,最后是总结。
2.相关工作
2.1 基于网格的聚类
基于网格的聚类方法采用了格网的数据结构,它将数据空间量化为有限数目的单元,这些单元形成了格网结构,所有的聚类操作都在格网上进行。这种方法的主要优点是处理速度快,其处理时间独立于数据对象的数目,仅依赖于量化空间中的格网单元总数目。
CLIQUE[2]算法是采用Apriori性质基于格网的空间聚类算法,但它同时非常好地结合了基于密度的聚类算法思想,因此既可以像基于密度的方法发现任意形状的簇,又可以像基于格网的方法处理多维数据集,但在低维空间进行聚类是高效的。
2.2 考虑约束条件的聚类
考虑约束条件下的的聚类算法还不多,在现有的约束聚类算法中,有效高效率、伸缩性强的、能处理复杂的空间数据,与数据输入顺序无关的约束空间聚类还未找到。而基于网格的聚类对处理复杂的空间数据是有效的,且对数据的输入顺序无关,有较高的效率与伸缩性,把约束引入到基于网格的聚类方法中应是对上述问题的一种解决途径。CON-CLIQUE算法[3]中只考虑了空间实体对约束,而没有考虑对其它类型的约束;孙宇清等[4]在2006年提出了一种基于格网的障碍约束下空间聚类算法,该算法在CLIQUE算法的基础上,引入障碍格网的概念和障碍物的格网化表达,使其能够处理任意形状的障碍约束聚类。处理方法简单易于理解,但没有处理便利问题。
本文就基于网格的聚类方法,研究如何在格网结构中表达空间障碍实体和空间便利实体并适合于基于网格的聚类过程,从而能保留基于网格的聚类方法的特点,又可以处理空间实体约束的问题,从而提高聚类的质量。
3.二阶段法处理考虑实体约束的的空间聚类算法
3.1 算法的基本思想
聚类的关键就是如何根据目的,依据聚类对象的各种属性,建立适当的距离函数或者相似性度量方法。本文由于要考虑具有空间位置的实体对聚类对象间(或簇间)的距离或相似度的影响,把空间属性和非空间属性分别处理,进行二阶段的聚类。第一阶段聚类是只针对非空间属性维,依据特定的距离定义,得到第一阶段聚类的结果,这里称为候选簇,作为第二阶段聚类的初始数据。而在第二阶段聚类中,把候选簇和空间约束实体在二维格网结构中表达,并运用基于网格的聚类方法聚类。得到的结果就是即考虑空间和非空间属性,又考虑到空间实体约束的具有较高质量的聚类簇。最后,采用边界处理技术进行边界点的提取,进一步提高聚类质量。
3.2 空间实体约束在格网结构中的表达与处理
在二维空间信息系统中障碍或者便利一般被分为两类,即线型障碍,和面型障碍,同样空间便利也可以分为两类,即线型便利和面型便利[5]。
障碍约束:在空间聚类中,障碍是指空间中不可穿越的实体,这些实体对象占据着一定的空间区域。空间实体可分为点实体、线型实体和面型实体,本文研究的是针对
您可能关注的文档
最近下载
- 手术室护士的职业暴露与防护课件.pptx VIP
- 机械工程测试技术基础的期末考题及答案.docx VIP
- 药店医疗器械质量管理制度.docx VIP
- 高二物理电场综合测试练习试卷及答案.doc VIP
- (2023春)大象版六年级科学下册全册教案(教学设计).doc
- 社区获得性肺炎重症的护理查房.pptx VIP
- 高考物理复习《带电粒子在电场中的力电综合问题》强化练习含答案.pdf VIP
- 广告牌安装安全协议书范本(标准版).doc VIP
- 湖北省武汉市东湖新技术开发区 2024-2025学年七年级上学期期末道德与法治试卷.docx VIP
- 宝胜电缆中英文对照样本Product-Catalogue.pdf VIP
原创力文档

文档评论(0)