基于Hadoop云计算平台的图像分类与标注.PDF

基于Hadoop云计算平台的图像分类与标注.PDF

电信 科 学 2014 年第 2 期 研 究与开发 基于 Hadoop 云计算平台的图像分类与标注 * 陆寄远 1 ,黄承 慧 1 ,侯 昉 1 ,李 斌 2 (1. 广 东金 融 学院计 算机 科 学与技 术 系 广 州 510521 ; 2. 甲骨文研 究开发 中心 (深圳 )有 限公 司 深圳 518057 ) 摘 要 :为有 效 处 理 并 利 用 互 联 网海 量 的 图像 和视 频 数 据 ,提 出 了一 种 基 于 Hadoop 云 平 台 的 图像 分 类 和标 注 解 决 方 案 。 针 对 如 何 高 效 地 进 行 训 练 集 提 取 这 一 重 要 问题 ,搭 建 了基 于 云计 算 的 图像 抓 取 平 台 ,利 用 互 联 网 的 图像 资 源 作 为 原 始 数 据 集 ,为 提 取 训 练 集 图像 提 供 足 够 的数 据 ;实 现 了基 于 概 率 潜 在 语 义 分 析 模 型 的训 练 集 图像 提 取 功 能 ,对 原 始 数 据 集 进 行 基 于 主题 的聚类 ,帮 助 用 户 快 速 选 取 训 练 集 图像 ;加 入 了 SVM 分 类 模 型 ,利 用 提 取 出来 的训 练 集 对 未 标 注 图像 进 行 分 类 标 注 ,实 现 了完 整 的系统 。 实 验 结 果 表 明 ,该 方 案 能 够 满 足 海 量 图 像 数 据 分 类 和标 注 的功 能 和性 能需 求 。 关 键 词 : 云计 算 ;训 练 集 提 取 ;支 持 向量 机 ;视 觉 特 征 提 取 doi: 10.3969/j .issn.1000-080 1.20 14.02.008 Image Classification and Annotation Based on Hadoop Cloud Computing Platform 1 1 1 2 Lu Jiyuan , Huang Chenghui , Hou Fang , Li Bin ( 1. Department of Computer Science and Technology, Guangdong University of Finance, Guangzhou 510521, China; 2. Oracle Research and Development Center (Shenzhen) Co., Ltd., Shenzhen 518057, China) Abstract: In order to effectively deal with the massive image and video data in internet, a solution for image classification and annotation based on Hadoop cloud platform was proposed. Firstly, a system based on cloud computing was given to crawl the raw data image from WWW. Secondly, a training image extractor based on pLSA (

文档评论(0)

1亿VIP精品文档

相关文档