- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像文本检测参考文章:图像文本定位技术研究---黄治虎图像与视频中的文本定位技术研究综述---廖佳,王红梅,牛晓东图像中的文本定位技术研究综述---晋瑾 ,平西建, 张涛, 陈明贵自然场景中文本检测技术研究综述---戴津图像和视频中的文本包含丰富、明确的信息。 如果这些文本能被自动地提取出来,则对图像高层语义的自动理解、索引和检索是非常有价值的 图像中的文本提取可概括为两个步骤:①文本定位。 即找出图像中文本所在的位置或刚好包围文本的矩形区域。 ②文本识别 对定位出的文本区域进行二值化、增强处理, 再送入光学字符识别系统 (OCR)中进行字符识别。文本定位是文本识别的前提, 是文本提取的关键文本类型:1、人工添加文本人工文本通常出现在视频帧图像中,如在新闻视频中由人工加入的新闻标题、时间等,体育赛事中人工加入的分数记录等,访谈节目中对话的脚本字幕等,通常有重要的提示作用2、自然场景文本场景文本是指拍摄场景中所包含的文字,如人们使用数码相机、数码摄像机、扫描仪等拍摄的自然场景的文本图像。因自然文本所处的图像或视频背景复杂,受光照、拍摄角度、拍摄场景等因素影响,自然场景文本定位是一个具有较大难度性和挑战性的研究课题性能评价:1、文本定位矩形框的精确度由标定的矩形与Ground-truth 矩形的重合度来衡量,两者的重合度越高,文本定位精度越高2、统一的样本图像库现在大多用ICDAR推出的样本图像库来评定。该图像库主要是通过数码相机拍摄得到的场景图像,以门牌、广告、指示标识为主查准率:文本区域数 / 所有区域总数查全率: 正确定位的文本区域数 / 图像中所有文本区域总数文本定位应用:1、图像、视频检索2、网络图像过滤3、智能交通4、邮件分拣等文本的特征1.颜色特征大多数情况下,同一区域中同一行文字,其颜色、色调、亮度等属性相同或相似,与图片背景有较大的对比度。人工文本尤其如此。但也有特殊情况(艺术)。2.字符的大小同一行文字,字符大小基本一致。但同一图像中的文字大小,可能差别很大,大的可能占到图像面积的80%以上,而小的则只有几个像素。由于太小的字符,识别率不高,像素低于10 的字符通常被删除。3.字符的边缘由于字符与图像背景间具有一定的对比度,因而字符与背景间都有较突出的边缘,这为通过边缘检测进行文本定位提供了依据。边缘包含边缘强度和边缘方向两个要素。不同的文字,边缘的方向不同,如英文和汉字的边缘方向集中在水平、垂直和45°方向,而拉丁文的边缘方向集中在垂直方向。4.文字的结构典型文档图像的布局都是经过精心设计,相对固定以便于读者阅读。这就降低了文本区域的分割的难度。但是对于自然场景当中的文本,它可能出现在图像的任意位置,并且往往字符稀疏,字符对齐方式没有严格要求。但是对于同一文本块内,文字的字体和字号往往保持一致,汉字在同一字体和字号下,其高度和宽度以及粗细一致,线条平直。5.纹理特征纹理是一种反映图像中同质现象的视觉特征,它体现了物体表面的具有缓慢变化或者周期性变化的表面结构组织排列属性。纹理具有三大标志:某种局部序列性不断重复、非随机排列、纹理区域内大致为均匀的统一体。纹理不同于灰度、颜色等图像特征,它通过像素及其周围空间邻域的灰度分布来表现,即:局部纹理信息。局部纹理信息不同程度的重复性,即全局纹理信息。文本定位主要技术方法利用的文本特征基于区域的方法主要利用颜色这一特征。基于边缘检测的方法主要利用边缘信息这一特征。基于纹理特征的方法主要利用纹理这一特征。
文档评论(0)