- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中南地区城市勘测改革发展暨学术研讨会论文集
DLG数据挖掘的研究
胡德承
(汕头市测绘研究院,广东汕头515041)
摘要:DLG数据挖掘就是从数字线划图中提取用户感兴趣的空间模式与特征、空间数据与非空间
数据的普遍关系及其它一些臆含在数字线划图中的普遍的数据特征的过程。本文对DLG数据挖掘的
技术和方法进行了探讨。
关键词:数字线划图(DLG);空间数据;数据挖掘;聚类;关联规则;分类
l引言
这是—个信息爆炸的时代,信息过量成为人们需要面对的问题。大量信息在给人们带来方便的
同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三是信息安
全难以保证;第四是信息形式不一致,难以统一处理。人们开始考虑:“如何才能不被信息淹没,
而是从中及时发现有用的知识、提高信息利用率?”面对这一挑战,数据挖掘(DataMining,DM)
技术应运而生,并显示出强大的生命力。
由于空间数据采集的手段越来越丰富,特别是电子信息技术和遥感技术融人到空间数据采集中
来以后,空间数据采集的效率及质量大幅提高,空间数据的数量、大小和复杂性都在飞快地增长,
已经远远超出了人们的解译能力。终端用户不可能详细地分析所有的这些数据,并提取感兴趣的空
Data
间知识,致使“空间数据爆炸但知识贫乏州”。因此,利用空间数据挖掘(SpatiMMining,SDM)
从空间数据库中挖掘事先未知却潜在有用的空间知识显得十分必要。数字线划图(DLG)是空间数
据的主要表现形式,是空间信息的重要载体,其中隐含了无限的空间知识。为此,本文探讨DLG
数据挖掘的技术和方法。
2空间数据挖掘的方法
in
Database,KDD),它是从大量的、
数据挖掘又称数据库中的知识发现(KnowledgeDiscovery
不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、
但又是潜在有用的信息和知识的过程。空间数据挖掘是数据挖掘的分支学科。目前空间数据挖掘已
经成为研究热点,但研究主要集中在空间数据挖掘的属性知识发现方面嘲。空间数据挖掘指的是从
空间数据库中抽取隐含的知识、空间关系或非显式地存储在空间数据库中的其它模式,用于理解空
.82-
中南地区城市勘测改革发展暨学术研讨会论文集 2006
间数据、发现空问和非空间数据间的关系、构建空间知识库、优化查询、重组空间数据库,以简单
精确的方式描述通用特征等等o】。典型的空间数据挖掘方法有如下三种:
Association
2.1空间关联规则分析【Spatial Rule)
空间关联规则表示了空间物体的空间属性之间、空间属性与非空间属性之间的依赖关系。其一般形
式为:A—帕Is%,c%】。其中A、B是空间滑词,空间滑同的形式有三种:表示拓扑结构的谓词、表示空
(x,-park-)【o.5%,80%]是—条空间关联规则,它表示80%的靠近运动中心的学校同时也靠近公园,
support(”B)=num(AUB)/num(tree)×100%
conf
idence(A也)=hum(AuB)/num(A)×100%
项集A的记录数;hum(tree)为事务数据库中的记录总数。
关联规则挖掘的目的在于找出那些可信的并且有代表性的规则。对于置信度太低或支持度太低
为阀值,它们限制了关联规则成立的条件。
通过邻接关系操作,可以直接得到目标对象与其他特定类型对象之间的各种空间关联关系,支
持度大于给定阈值的关联关系可以运用Apriori算法生成最终的关联规则。
Clustering)
2.2空间聚类分析(Spatial
聚类分析主要是根据实体的特征对其进行聚类或分类,按一定的距离或相似测度在大型多维空
间数据集中标识出聚类或稠密分布的区域,将数据分
原创力文档


文档评论(0)