- 3
- 0
- 约5.78千字
- 约 11页
- 2021-01-07 发布于山东
- 举报
基于 Adaboost 的视频文本定位
摘要:提出了一种基于 Adaboost 的视频文本定位的新
方法。首先我们提取视频图像中的连通域,经过对视频文本
区域分析,提取了视频文本的 5 类特征,然后利用这 5 类特
征经过分类与回归决策树构造了 Adaboost 强分类器,最后将
候选文本区域送入强分类器,得到正确的文本区域。实验结果表明本方法不仅对视频帧图像中字体、大小和颜色多变的文本具有很好的定位效果而且还实现了视频文本定位要求的快速性和准确性的特点。
关键词:文本定位;文本识别;连通域;强分类器;分类与回归决策树
中图分类号: TP391 文献标志码: A 文章编号:
1007-2683( 2017) 01-0103-06
引言
随着多媒体网络技术的发展,大量的视频进入了人们的
学习、生活和工作当中。然而视频中的文本信息作为一种重
要的语义信息, 对视频的理解、 分析和检索有着重要的作用。
视频文本识别主要包括两步。第一步,对视频帧中的文本进
行定位;第二步,获取文本定位区域中的文本信息。然后将
获取的文本信息送入到 OCR 或利用其他的文本识别技
最近几年,不少视频文本提取的相关算法应运而生。 Li
等通过利用混合小波神经网络对 16× 16 像素块的视频帧进行检测; Zhong 和 Crandall 利用文本图像在垂直和水平方向亮度的变化规律在 8×8 的 DCT 压缩域直接实现了文本检测。但是基于块的方法在文本定位不够精确。数学形态学,角点检测和边缘检测也是大多学者经常采用的方法。工作人员在制作视频时,对于具有文本的区域,往往使其前景与背景具有鲜明的对比度,在频域上这种对比度表现为高频特征,而在空域上可以通过角点和边缘点来表现,因此角点和
边缘检测经常是文本定位采用的方法。例如, Hua 等人先利
用 SUSAN 角点检测算子获得视频帧的角点图,然后对角点按照一定的规律进行合并和过滤最终定位文本区域。这种方法应用起来比较简单,速度较快,但是对噪声比较敏感,只能处理背景简单的视频文本。
近几年基于 Adaboost 的学习方法也被大量应用于文本
识别,并且取得了良好的效果。例如, Chen 和 Yuille 利用文
本图像的 X 和 Y 偏导数、灰度直方图和边缘连接特征进行
Adaboost 学习实现文本定位。
以上方法虽然可以实现文本定位,但是效果并不理想。
由于视频文本本身的低分辨率,复杂的背景,文本的颜色,
字体以及大小多变性等因素使视频文本定位存在不小的难
度。
1 Adaboost 算法
AdaBoost 算法通 将大量分 能力一般的弱分 器按
照一定方法 合起来,构成一个分 能力很 的 分 器。
Keams 和 Valiant 已 明,只要有足 的分 能力比随机猜
好的分 器,就能将 合成 分率 于 0 的 分 器。
Adaboost 算法根据每次 集中各 ? 姆 欠裾 ?确以及上一次的 体分 准确率来确定每个 本的 ,将修改
的新数据送 下 分 器 行 ,然后将每次 得到的分 器融合起来,作 最后的决策分 器, 目 的搜索 。
假 入 n 个 本: {x1 ,y1} , {x2 , y2} ,?,
{x2n/sub ,yn} ,其中 yi={0 ,1} ,i=1 ,2,?, n;0 表示假
本, 1 表示真 本。已知 本中有 a 个假 本和 b 个
真 本, 第 .j 个生成的 分 器如式( 1)所示。
(1)其中: hi 表示 分 器的 ; θi 表示 ; pi
表示不等号的方向, 只能取± 1;fi 表示特征 , j=1 ,2,?,
n。
步 1:初始化 差 , 于 yi=0 的假 本,
W1,
i=1/2a ; 于 yi=1 的真 本, W1 , i=1/2b ;
步 2:For t=1 ,2,?, T,其中 T 的次数;
2) 每个特征 j,循 生成相 的弱分 器 hj , 算相 于当前 重的 差:
2)
3)选择具有最小误差 ε j 的弱分类器 ht 加入到强分类器
中去;
4)更新每个样本所对应的权重;
3)
步骤 3:形成强分类器为
4)
Adaboost 算法相比于其他机器学习算法所具备的优点:
第一,构造一个弱分类器比直接构造一个高精度的强分类器
简单的多;第二,不会过度拟合,不会随着迭代次数的增加
而降低其泛化能力。
候选区域检测
候选区域生成的主要任务是提取图像中的连通区域。其
中包括文本区域和非文本区域。然后将这些连通域送入利用
Adaboost 生成的强分类器。 从而将连通区域中的非文本区域
剔除,最终得到准确的文本区域。
2.1 灰度化处理
文进行边缘检测,首先将彩色的视频帧图像灰度化,以
减少后续
您可能关注的文档
最近下载
- 哈弗H6国潮版汽车使用手册说明书pdf电子版下载.pdf
- 2023北京朝阳初三一模物理试卷含答案.pdf VIP
- 廉洁的好处与如何做.doc VIP
- SIEMENS-AXIOM Artis中文操作手册.pdf VIP
- 新常态下企业顶层设计.ppt VIP
- 中国青瓷艺术鉴赏知到智慧树期末考试答案题库2025年丽水学院.docx VIP
- 2026年春季学期主题班会安排表.docx
- 5年(2021-2025)北京中考物理真题分类汇编:专题08 压强(解析版).docx VIP
- 三年级下册英语 (外研版) 全册考点梳理 + 综合练习 (附答案).docx VIP
- 2020人工智能赋能先进制造行业研究报告.docx
原创力文档

文档评论(0)