- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
空间数据挖掘与可视化
信息工程大学地理空间信息学院
李宏伟
2 空间数据挖掘研究
1 背景
3 实例:空间关联规则挖掘
5 空间知识可视化
6 几点思考
4 数据挖掘软件
1 背景
By 李德仁
数据(Data)
信息(Information)
知识(Knowledge)
智能(Wisdom)
DIKW
大数据
海量数据
数量
价值
多样性
速度
数量
2.1 空间分类挖掘
分类和预测是两种数据分析形式,用于提取描述重要数据类的数据类型或预测未来的趋势。空间分类挖掘解决大量数据分类问题。
2 空间数据挖掘研究
空间分类挖掘方法
决策树方法:经典算法-Quinlan的ID3方法
贝叶斯分类方法:朴素贝叶斯方法和贝叶
斯网络方法
神经网络方法:前向型、反馈型、随机型、
自组织型
支持向量机方法:基于统计学习理论,适于
数据预处理、样本化应用
空间分类挖掘方法(续)
K-最邻近分类法
基于案例的推理分类法
遗传算法和进化计算
粗糙集分类法
2.2 空间聚类挖掘
统计学方法
机器学习方法
数据库方法
模式识别方法
基于模型的方法
基于密度的方法
基于划分的方法
基于层次的方法
基于网格的方法
混合方法
方法分类
具体方法
聚类与分类不同,待划分的类是未知的。聚类将数据对象分组为多个类或簇,使同一个簇中的对象之间相似度最高,不同簇中的对象相似度最低。
2.3 空间关联规则挖掘聚类挖掘
基本研究内容
确定性关联规则挖掘
量化关联规则挖掘
增量式关联规则挖掘
模糊关联规则挖掘
广义关联规则挖掘
经典算法:Apriori算法
Apriori算法改进
利用hash表的DHP方法
基于采样的方法
并行关联规则挖掘的方法
分布式关联规则挖掘的方法
多层次关联规则挖掘的方法
数值扩展的关联规则挖掘的方法
形象规则的发现方法
关联规则快速学习方法
基于兴趣度进行数值型关联规则合并的方法
采样trie树进行关联规则挖掘
利用概念格的关联规则挖掘的方法
……
2.4 Internet和Web空间数据挖掘
Web挖掘
内容挖掘
结构挖掘
用法挖掘
基于机器学习技术的文本搜索引擎
基于协同的方法
基于内容的方法
2.5 空间数据挖掘智能方法
神经计算、进化计算、免疫克隆计算、模糊计算与模糊推理……
3 实例:空间关联规则挖掘
发展阶段
萌芽阶段
1993
2000
2006
2011
1993年,Agrawal等人提出频繁项集挖掘的Apriori算法。
1995年,Koperski and Han 引入空间谓词构造空间事务 表,给出空间关联规则的定义及挖掘过程。
2000年,Clementini 等考虑空间不确定性并对多层次空间关联进行挖掘
2001年, Shekhar 等给出空间同位模式的一般挖掘算法
2004-2005年,Yoo等通过减少连接计算以提升同位模式挖掘的效率
2006年,陈江平等提出了一种面向主题的基于多层次空间概念的关联规则挖掘算法
2008年,张雪伍、苏奋振等提出面向时空过程的关联规则挖掘算法
2009年,沙宗尧等人提出局部的空间关联模式挖掘
2011年,Mohan 等基于事件时序关系提出级联模式的概念及挖掘算法
2014年,邓敏、石岩等基于聚类分割方法研究了太平洋气候指数与我国极端降水事件的遥相关模式
3.1 空间关联规则挖掘研究的发展
3.2 空间关联规则分类
不同地理实体间空间依存、相互作用、因果或共生的模式
邻近地理空间内频繁出现的布尔型要素(或事件)子集
地理事件间远距离的相互关联模式
空间关联
规则
基于空间谓词规则的关联模式
空间同位模式
遥相关模式
城市分布
交通发展
3.3 当前研究重点
着眼于研究挖掘算法本身
着眼于研究空间关联规则的不确定性信息
着眼于研究关联挖掘的可视化
着眼于研究弱空间关联规则
3.4 空间关联规则挖掘方法
将各个空间或非空间属性作为一个图层,对每个图层上的数据点进行聚类,然后对聚类产生的空间紧凑区进行关联规则挖掘。
利用空间叠加、缓冲区分析等方法发现挖掘目标之间的空间谓词,将其组成空间事务数据库,进行单层布尔型关联规则挖掘。
通过用户指定的邻域,遍历所有可能的邻域窗口,进而通过邻域窗口代替空间事务,然后进行空间关联规则的挖掘。
基于聚类的图层覆盖法
基于空间事务的挖掘方法
无空间事务挖掘法
3.5 空间关联规则挖掘过程
以基于事务的空间关联规则挖掘过程为例
web
3.6 空间关联规则挖掘算法
挖掘算法:
Apriori
FP-Growth
Eclat
3.7 存在问题
在当今“数据爆炸”的大环境下,开发出效率高,负载
文档评论(0)