基于mapreduce框架的大型多媒体数据挖掘.PPT

下载文档 降价啦

8
0
约3.86千字
约 40页
2018-06-13 发布于天津
举报
保障服务

基于mapreduce框架的大型多媒体数据挖掘.PPT

基于mapreduce框架的大型多媒体数据挖掘

接下来我们将集中关于多媒体数据挖掘的三大热点进行讨论，其中包括图像分类，视频事件检测和近似重复的视频检索。分为四个阶段 1、数据表示 2、特征提取 3、聚类 4、Bag of feature 数据表示 Hadoop对于输入的数据提供了对多个不同格式的支持。在每种类型的输入过程中，数据都可以有特别的进行划分，然后再并行的传输到mapper。传统的hadoop的实现比较擅长处理文本数据，在以合理的格式显示图像和视频数据可能会遇到很多难题。为了成功的达到识别图像和视频信息，我们允许一个mapper来处理整个输入文件，为了实现这个目标，我们自定义InputFormat和RecordReader，这两个是hadoop实现过程中的两个类。在自定义之后，视频和图像文件可以以原始流的形式显示，因此可以使随后的处理更加的有效。特征提取特征提取是大多数多媒体数据挖掘任务中最重要的步骤之一。在这项工作中，我们专注于图像分类，视频事件检测和近似重复的视频检索。因此，一种基于MapReduce的检测是有必要的。检测图像用的Harris-Laplace检测器或致密采样检测器和检测视频用的时空兴趣点检测器（STIP）。经过检测2D/3D兴趣点，特征描述会对这些关键点的局部特征的图像进行描绘，如尺度不变的特征提取分析（SIFT）和视频的方向梯度直方图（HOG）。在基于MapReduce的实现中，每个

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于mapreduce框架的大型多媒体数据挖掘.PPT