- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
15.2多媒体数据挖掘.ppt
;第15章 复杂对象数据挖掘 ;15.1 空间数据库挖掘
15.2 多媒体数据挖掘
15.3 文本挖掘
15.4 挖掘万维网
;15.1 空间数据库挖掘 ;15.1.1 空间数据概述;15.1.1.2 空间查询工作 ;很多基本空间查询是数据挖掘行为的基础,这些查询包括:
区域查询或范围查询:寻找那些与在查询中指定区域相交的实体。
最邻近查询:寻找与指定实体相邻的实体
距离扫描:寻找与指定的实体相距一段确定距离的实体,这个距离是逐渐增大的。
小提示:所有这些查询都可以用来辅助空间聚类或分类操作。
;15.1.2 空间数据挖掘中的基础计算模型 ;大值方法:定义实体A和B的距离为A中的所有点与和B中的所有点之间的欧氏或曼哈顿距离中最大的,即
(15-2)
平均值方法:定义实体A和B的距离为A中的所有点与和B中的所有点之间的欧氏或曼哈顿??离的平均值,即
(15-3);中心方法:定义实体A和B的距离为A中的中心点与和B中的中心点之间的欧氏或曼哈顿距离的平均值,即
(15-4)
其中最简单的方法就是取实体A的中心点和B的中心点,该中心点可以通过查找实体的几何中心来识别。
;15.1.2 空间数据挖掘中的基础计算模型;包含于: A包含于B,表示A的所有点都在B里,反之不一定。
覆盖/包含: A覆盖或包含B,当且仅当B包含于A。
(3) 方位是描述两个点状实体位置关系的一种度量,如果要分析面状实体间的方位关系,则应把多边形转换为重心点或其它点状实体。
;15.1.2.2空间实体信息模型 ;15.1.2空间数据挖掘中的基础计算模型;15.1.2 空间数据挖掘中的基础计算模型;15.1.2空间数据挖掘中的基础计算模型;15.1.2空间数据挖掘中的基础计算模型;15.1.3 空间数据挖掘基础;图15-5 空间数据挖掘的体系结构;15.1.3.2 空间数据挖掘的方法体系;15.1.4几种空间数据挖掘算法; 挖掘空间关联规则的有效方法是自上而下、逐步加深的搜索技术。首先在高的概念层次进行搜索,在较粗的精度级别查找频繁发生的模式和在这些模式中较强的隐含关系;然后,对频繁发生的模式加深搜索至较低的概念层次,这种处理持续到找不到频繁发生的模式为止。;15.1.4.1空间关联分析;15.1.4.2空间分类算法和空间趋势分析;空间决策树有五个主要步骤:
根据已知的分类,从数据D中找到例子S。
确定最佳谓词p用来分类。一般首先在较粗的层次中寻找相关谓词,然后再在较为细化的层次。
;找到最佳的缓冲区大小和形状。对于取样中的每个实体,它周围的区域被称为缓冲区。目标是选择一个能产生对测试集中的类型进行最不同的缓冲区。
使用p和C,对每个缓冲区归纳谓词。
使用泛化的谓词和ID3建造二叉树T。;15.1.4.3 空间聚类方法;15.1.4.3 空间聚类方法;计算新的聚类中心 式中Nj 为第j个聚类域中包含的样本个数。
若 则停止迭代,第t 次迭代结果为划分为k 个类别的聚类方案,转向(7) ;否则,t = t + 1 ,转向(4) 。
当k m 时,k = k + 1 ,转向(3) ;否则,系统聚类结束。
;15.2 多媒体数据挖掘;15.2.2 多媒体数据挖掘概述;15.2.2.2 多媒体数据挖掘的内容;多媒体数据挖掘的内容;15.2.3 多媒体数据挖掘方法;15.2.3.2 多媒体数据的相似搜索;两种查询;15.2.3.2 多媒体数据的相似搜索;15.2.3.3 多媒体数据的分类和预测分析;15.3 文本挖掘;文本挖掘的一般过程;15.3.1.2 文本挖掘的主要任务;15.3.1.3 文本挖掘与信息检索;文本的表示
文本表示是指用文本的特征信息集合来代表原来的文本.向量空
文档评论(0)