152多媒体数据挖掘.PPT

  1. 1、本文档共111页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
152多媒体数据挖掘

Copyright 2003-12, SPSS Taiwan Corp. 数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编  邓 松 李文敬 刘海涛 编著 电子工业出版社 15.1 空间数据库挖掘 15.1.1 空间数据概述 空间数据是指与二维、三维或更高维空间的空间坐标及空间范围相关的数据 空间数据的复杂性特征有: 空间属性之间的非线性关系 空间数据的多尺度特征 空间信息的模糊性 空间维数的增高 空间数据的缺值 空间查询工作 空间查询及其操作的主要特点有: 空间操作相对复杂和不精确 空间连接(Spatial Join)问题 相同的地理区域经常有不同的视图 一个空间实体可用空间和非空间的属性来描述 空间查询工作 很多基本空间查询是数据挖掘行为的基础,这些查询包括: 区域查询或范围查询:寻找那些与在查询中指定区域相交的实体。 最邻近查询:寻找与指定实体相邻的实体 距离扫描:寻找与指定的实体相距一段确定距离的实体,这个距离是逐渐增大的。 小提示:所有这些查询都可以用来辅助空间聚类或分类操作。 15.1.2 空间数据挖掘中的基础计算模型 空间关系计算 (1) 常用的两个空间实体之间的距离有: 最小值方法:定义实体A和B的距离为A中的所有点与和B中的所有点之间的欧氏或曼哈顿距离中最小的,即 (15 -1) 空间关系计算 空间关系计算 中心方法:定义实体A和B的距离为A中的中心点与和B中的中心点之间的欧氏或曼哈顿距离的平均值,即 (15-4) 其中最简单的方法就是取实体A的中心点和B的中心点,该中心点可以通过查找实体的几何中心来识别。 15.1.2 空间数据挖掘中的基础计算模型 (2) 两个空间实体之间存在若干拓扑关系。这些关系基于两个实体的位置: 分离(Disjoint) :A与B分离,表示B中任何点都不在A中,反之亦然。 重叠/相交: A与B重叠或相交表示至少有一个点既在A里也在B里。 等价: A与B这两个实体的所有点都是共有的。 15.1.2 空间数据挖掘中的基础计算模型 包含于: A包含于B,表示A的所有点都在B里,反之不一定。 覆盖/包含: A覆盖或包含B,当且仅当B包含于A。 (3) 方位是描述两个点状实体位置关系的一种度量,如果要分析面状实体间的方位关系,则应把多边形转换为重心点或其它点状实体。 空间实体信息模型 空间场模型 空间场模型主要用于模拟在空间上连续分布的地理现象,属性取值既可以式连续的,也可以是离散的。 空间场数据模型的优点是数据结构简单,便于空间法分析与模拟。缺点是不利于表达空间实体,数据量也大。 15.1.2空间数据挖掘中的基础计算模型 空间要素模型 图15-3 基于要素的空间信息模型对现实世界的抽象 15.1.2 空间数据挖掘中的基础计算模型 小提示:实体必须符合三个条件:①可被识别,②重要(与问题相关),③可被描述(有特征)。 表15-2 现实世界与信息世界的对应关系 15.1.2空间数据挖掘中的基础计算模型 空间网络模型 空间网络结构模型中地理现象被抽象为链、结点以及它们之间的连通关系(图15-4 对空间网络的抽象)。 图的形式化定义为 (15-10) 图15-4 对空间网络的抽象 15.1.2空间数据挖掘中的基础计算模型 位置—属性一体化的空间实体信息模型 一般空间实体的形式化模型为一个四元组,分别代表空间实体四个方面的特征。其中位置特征数据为

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档