- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 35 卷 第 3 期 武 汉 大 学 学 报 ·信 息 科 学 版 Vol . 35 No . 3
20 10 年 3 月 Geomatics and Information Science of Wuhan U niver sit y March 20 10
文章编号 :167 18860 (20 10) 文献标志码 :A
一种基于局部分布的空间聚类算法
1 1 1
刘启亮 李光强 邓 敏
( 1 中南大学测绘与国土信息工程系 ,长沙市麓山南路 932 号 ,4 10083)
摘 要 :设计了一种度量邻近域内空间实体局部分布的新指标 ———中值角度 ,在此基础上 ,提出了一种基于空
间实体局部分布的空间聚类算法 。该方法递归搜索空间实体集中所有局部分布度量值相近且非离群的点 ,并
将其聚为一类 。通过模拟数据和实际数据进行实验发现 ,所提出的算法比DB SCAN 算法的聚类结果更合理 ,
具有很好的抗噪性 ,能发现任意形状的聚类 。
关键词 :空间聚类 ;局部分布 ;邻域 ;DB SCAN 算法
中图法分类号 :P208
空间聚类是空间数据挖掘与空间分析的重要 部分和离群部分 。采用多次循环迭代搜索的方
手段之一 ,常用于揭示空间数据分布规律以及发 法 ,使聚集部分聚成一个簇 。由于这个聚类过程
现空间数据异常[ 1 ,2 ] 。现有的空间聚类算法大多 考虑了空间实体的局部分布 , 因此称本文的聚类
(
依据空间实体间的距离和邻近域内实体数 目进行 算法为基 于局部分布 的空 间聚类算法 local
聚类 ,没有顾及空间实体邻近域内实体的局部分 di st ribution ba sed sp atial clu st ering algorit hm ,
布情况 。文献[ 3 ] 提出了一种基于局部分布的异 L DB SC) 。
常探测方法 ,该方法采用局部平均距离 、局部密度
和局部对称度 3 个参数 ,并赋予不同的权重来反
映数据的局部分布 。该方法需要用先验知识确定
权值 ,因此权值的确定比较困难 。文献[4 ]提出了
一种加权角度方差法 ,并用于探测偏离点 。这种
方法计算较为复杂 ,并且采用的加权角度方差度
量指标不能很好反映角度值的平均大小特征 ,而
且易受极大 、极小值的影响 。
针对上述问题 ,本文提出了一种基于角度的 图 1 空间实体的角度分布度量
空间实体局部分布度量方法 。如图 1 所示 ,在空 Fig . 1 AngleBased Di st ribution Mea sure for
间点集 S n 中, O 点远离其他点, 从而导致 O 点与 Sp atial Obj ect s
( γ)
S n 中其他任意两点组成的夹角 记为 的变化范
围相对较小而且角度值也相对偏小 , 因此可以通 1 算法原理
过角度的变化范围及角度值的平均大小特征来反
映空间实体的局部分布情况 。根据这种性质 ,本 1 . 1 基于角度的局部分布度量
文档评论(0)