图像文本定位剖析.pptx

图像文本定位剖析

图像文本检测;参考文章: 图像文本定位技术研究---黄治虎 图像与视频中的文本定位技术研究综述---廖佳,王红梅,牛晓东 图像中的文本定位技术研究综述---晋瑾 ,平西建, 张涛, 陈明贵 自然场景中文本检测技术研究综述---戴津;图像和视频中的文本包含丰富、明确的信息。 如果这些文本能被自动地提取出来,则对图像高层语义的自动理解、索引和检索是非常有价值的 ;图像中的文本提取可概括为两个步骤: ①文本定位。 即找出图像中文本所在的位置或刚好包围文本的矩形区域。 ②文本识别 对定位出的文本区域进行二值化、增强处理, 再送入光学字符识别系统 (OCR)中进行字符识别。 文本定位是文本识别的前提, 是文本提取的关键;文本类型: 1、人工添加文本 人工文本通常出现在视频帧图像中,如在新闻视频中由人工加入的新闻标题、时间等,体育赛事中人工加入的分数??录等,访谈节目中对话的脚本字幕等,通常有重要的提示作用 2、自然场景文本 场景文本是指拍摄场景中所包含的文字,如人们使用数码相机、数码摄像机、扫描仪等拍摄的自然场景的文本图像。因自然文本所处的图像或视频背景复杂,受光照、拍摄角度、拍摄场景等因素影响,自然场景文本定位是一个具有较大难度性和挑战性的研究课题;性能评价: 1、文本定位矩形框的精确度 由标定的矩形与Ground-truth 矩形的重合度来衡量,两者的重合度越高,文本定位精度越高 2、

文档评论(0)

1亿VIP精品文档

相关文档