地理本体知识约束下DBSCAN空间聚类算法及应用.docVIP

地理本体知识约束下DBSCAN空间聚类算法及应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
地理本体知识约束下DBSCAN空间聚类算法及应用

地理本体知识约束下DBSCAN空间聚类算法及应用   摘要摘要:将定义好的地理本体及其关系应用到空间聚类分析过程中,通过逻辑规则推理,强化地理空间知识对聚类算法的指导,探索解决聚类分析缺乏地理知识约束等问题的方法,使聚类分析结果更合理。实现了一个基于本体约束的DBSCAN程序原型,并将聚类结果展示在Web电子地图中。以本体建立地理空间约束知识聚类分析实际上是对地理空间对象进行半监督的空间分析过程。原型系统验证表明,地理本体知识约束下的DBSCAN算法是可行的。   关键词关键词:地理本体;地理知识表达;DBSCAN;地理空间聚类分析;地理知识发现;空间大数据   DOIDOI:10.11907/rjdk.1511345   中图分类号:TP312   文献标识码:A文章编号文章编号   2016)002003305   0引言   地理信息系统(Geographic Information System)中,以形式化本体描述地理语义关系在各种相关应用中日益普遍,例如GIS数据的融合、查询以及最优路径查找和地理知识发掘。作为GIS的一个组成部分,地理空间聚类分析也可以考虑集成本体,例如将地理信息背景知识注入到标准的聚类算法中,以提高聚类算法的智能化。将地理背景知识(如行政区划、河流阻碍和土地类型等)和聚类分析操作用户作为环境条件,进行基于背景知识的推理,用以指导和监督聚类过程,使聚类结果更加合理。   地理空间数据挖掘[1]是在空间数据中抽取得到隐含的空间关系和空间知识,发现未显示的空间特征和模型。空间分析是这一工作的重要组成部分,也是GIS的本质所在。GIS通过空间分析功能,获取隐藏在地理数据之中的信息和关系[2]。空间分析最早从测绘学中发展起来,其在很多相关领域的应用都推动了空间分析的发展。例如生物学中要研究某物种的分布,流行病学有时要用到地图来研究传染病的传播情况,营销学要进行最佳商业网点的选址等。传染病学中GIS空间分析的一个著名案例是对1854年发生在英国伦敦地区的霍乱疾病的控制。在控制过程中,John Snow博士针对霍乱患者在地图上的空间分布进行分析,确认了引发霍乱的病源,同时也证实了霍乱是通过水而非空气传播,其空间分析如图1所示。   空间聚类分析(Spatial Clustering Analysis)[2]是地理空间数据挖掘的主要手段之一,已广泛应用于各类学科,例如地理学、地质学、城乡规划学及公共卫生等诸多领域。空间聚类是基于空间的分布关系,将地理空间中相类的对象分在同一集合(cluster),将不相类的对象分在不同的集合中。通过空间聚类方法,既可以发现隐含在地理空间数据中的分布规律,又可以与其它数据分析方法结合使用,发掘出更深层次的地理知识。同时,空间聚类分析是数据挖掘的重要组成部分,有的挖掘方法要以空间聚类为初始条件,例如在进行空间叠加分析前,需要知道地理实体聚类。地理信息科学如今已进入大数据时代,数据挖掘与知识发现更凸显出其重要作用,空间聚类技术的应用价值也日益显现。   1DBSCAN聚类算法及约束问题   DBSCAN(DensityBased Spatial Clustering of Applications with Noise)[3]是一个比较有代表性的基于密度的聚类算法。该算法采用地理空间对象的密度连接可以判断发现任意形状的聚集类,具体而言即存在于一个类中的每个对象,包含在其给定半径领域的对象应大于或等于一个给定的最小数量。   DBSCAN算法中的几个定义如下:   E领域(neighborhood of a point):存在对象p半径为Eps内的区域D称为该对象的NEps(p)领域,形式化定义为 NEps(p):{q∈D|dist(p,q)=Eps}。   核心对象(core objects):存在对象p的E领域内样本数大于等于MinPts(领域中包含的最小值),则给定对象p为核心对象。   直接密度可达(directly densityreachable):在聚类样本集合D中,如果对象q在对象p的NEps(p)领域之内,且p为聚类定义中的核心对象,则对象p直接密度可达对象q。   密度可达(densityreachable):对于聚类样本集合D,存在一串样本序列对象p1,p2,p3,...pn,其中前后两个对象可直接密度可达,则设存在p1密度可达qn。   密度相连(density connected):对于聚类样本集合D中任意一对象o,存在有一对象p到对象o密度可达,且存在另一对象q到对象o也可密度可达,则对象q与对象p是密度相连,如图2所示。   但是,传统没有地理语义约束的DBSCAN算法与实际环境中的空间聚类应用之

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档