图像文本定位探究.pptxVIP

  • 3
  • 0
  • 约小于1千字
  • 约 13页
  • 2017-10-02 发布于湖北
  • 举报
图像文本检测;参考文章: 图像文本定位技术研究---黄治虎 图像与视频中的文本定位技术研究综述---廖佳,王红梅,牛晓东 图像中的文本定位技术研究综述---晋瑾 ,平西建, 张涛, 陈明贵 自然场景中文本检测技术研究综述---戴津;图像和视频中的文本包含丰富、明确的信息。 如果这些文本能被自动地提取出来,则对图像高层语义的自动理解、索引和检索是非常有价值的 ;图像中的文本提取可概括为两个步骤: ①文本定位。 即找出图像中文本所在的位置或刚好包围文本的矩形区域。 ②文本识别 对定位出的文本区域进行二值化、增强处理, 再送入光学字符识别系统 (OCR)中进行字符识别。 文本定位是文本识别的前提, 是文本提取的关键;文本类型: 1、人工添加文本 人工文本通常出现在视频帧图像中,如在新闻视频中由人工加入的新闻标题、时间等,体育赛事中人工加入的分数??录等,访谈节目中对话的脚本字幕等,通常有重要的提示作用 2、自然场景文本 场景文本是指拍摄场景中所包含的文字,如人们使用数码相机、数码摄像机、扫描仪等拍摄的自然场景的文本图像。因自然文本所处的图像或视频背景复杂,受光照、拍摄角度、拍摄场景等因素影响,自然场景文本定位是一个具有较大难度性和挑战性的研究课题;性能评价: 1、文本定位矩形框的精确度 由标定的矩形与Ground-truth 矩形的重合度来衡量,两者的重合度越高,文本定位精度越高 2、统一的样本图像库 现在大多用ICDAR推出的样本图像库来评定。该图像库主要是通过数码相机拍摄得到的场景图像,以门牌、广告、指示标识为主 查准率:文本区域数 / 所有区域总数 查全率: 正确定位的文本区域数 / 图像中所有文本区域总数;文本定位应用: 1、图像、视频检索 2、网络图像过滤 3、智能交通 4、邮件分拣等;文本的特征;;;;文本定位主要技术方法利用的文本特征

文档评论(0)

1亿VIP精品文档

相关文档