电信 科 学 2014 年第 2 期
研 究与开发
基于 Hadoop 云计算平台的图像分类与标注 *
陆寄远 1 ,黄承 慧 1 ,侯 昉 1 ,李 斌 2
(1. 广 东金 融 学院计 算机 科 学与技 术 系 广 州 510521 ;
2. 甲骨文研 究开发 中心 (深圳 )有 限公 司 深圳 518057 )
摘 要 :为有 效 处 理 并 利 用 互 联 网海 量 的 图像 和视 频 数 据 ,提 出 了一 种 基 于 Hadoop 云 平 台 的 图像 分 类 和标 注
解 决 方 案 。 针 对 如 何 高 效 地 进 行 训 练 集 提 取 这 一 重 要 问题 ,搭 建 了基 于 云计 算 的 图像 抓 取 平 台 ,利 用 互 联 网 的
图像 资 源 作 为 原 始 数 据 集 ,为 提 取 训 练 集 图像 提 供 足 够 的数 据 ;实 现 了基 于 概 率 潜 在 语 义 分 析 模 型 的训 练 集
图像 提 取 功 能 ,对 原 始 数 据 集 进 行 基 于 主题 的聚类 ,帮 助 用 户 快 速 选 取 训 练 集 图像 ;加 入 了 SVM 分 类 模 型 ,利
用 提 取 出来 的训 练 集 对 未 标 注 图像 进 行 分 类 标 注 ,实 现 了完 整 的系统 。 实 验 结 果 表 明 ,该 方 案 能 够 满 足 海 量 图
像 数 据 分 类 和标 注 的功 能 和性 能需 求 。
关 键 词 : 云计 算 ;训 练 集 提 取 ;支 持 向量 机 ;视 觉 特 征 提 取
doi: 10.3969/j .issn.1000-080 1.20 14.02.008
Image Classification and Annotation
Based on Hadoop Cloud Computing Platform
1 1 1 2
Lu Jiyuan , Huang Chenghui , Hou Fang , Li Bin
( 1. Department of Computer Science and Technology, Guangdong University of Finance, Guangzhou 510521, China;
2. Oracle Research and Development Center (Shenzhen) Co., Ltd., Shenzhen 518057, China)
Abstract: In order to effectively deal with the massive image and video data in internet, a solution for image
classification and annotation based on Hadoop cloud platform was proposed. Firstly, a system based on cloud
computing was given to crawl the raw data image from WWW. Secondly, a training image extractor based on pLSA
(
您可能关注的文档
最近下载
- 2025年产品测试复盘与2026年质量提升方案.pptx
- 《理解人性》:阿德勒.doc VIP
- 如何找回误删微信好友,微信好友一键恢复.doc VIP
- 船用参比电极技术条件 编制说明.pdf
- 带头严守政治纪律和政治规矩,维护党的团结统一等四个方面存在的问题与整改材料9.docx VIP
- 数据中心800V直流供电技术白皮书.pdf VIP
- “四个带头”严守政治纪律和政治规矩,维护党的团结统一整改材料.docx VIP
- 带头严守政治纪律和政治规矩,维护党的团结统一等四个方面存在的问题与整改材料5篇(精选版).docx VIP
- 北京巴威锅炉技术介绍.ppt VIP
- 幼小衔接班数学练习题及单元综合题共27套(A4直接打印完整版).pdf VIP
原创力文档

文档评论(0)