基于mapreduce框架的大型多媒体数据挖掘.PPT

基于mapreduce框架的大型多媒体数据挖掘

接下来我们将集中关于多媒体数据挖掘的三大热点进行讨论,其中包括图像分类,视频事件检测和近似重复的视频检索。 分为四个阶段 1、数据表示 2、特征提取 3、聚类 4、Bag of feature 数据表示 Hadoop对于输入的数据提供了对多个不同格式的支持。在每种类型的输入过程中,数据都可以有特别的进行划分,然后再并行的传输到mapper。传统的hadoop的实现比较擅长处理文本数据,在以合理的格式显示图像和视频数据可能会遇到很多难题。 为了成功的达到识别图像和视频信息,我们允许一个mapper来处理整个输入文件,为了实现这个目标,我们自定义InputFormat和RecordReader,这两个是hadoop实现过程中的两个类。在自定义之后,视频和图像文件可以以原始流的形式显示,因此可以使随后的处理更加的有效。 特征提取 特征提取是大多数多媒体数据挖掘任务中最重要的步骤之一。在这项工作中,我们专注于图像分类,视频事件检测和近似重复的视频检索。因此,一种基于MapReduce的检测是有必要的。检测图像用的Harris-Laplace检测器或致密采样检测器和检测视频用的时空兴趣点检测器(STIP)。经过检测2D/3D兴趣点,特征描述会对这些关键点的局部特征的图像进行描绘,如尺度不变的特征提取分析(SIFT)和视频的方向梯度直方图(HOG)。 在基于MapReduce的实现中,每个

文档评论(0)

1亿VIP精品文档

相关文档