基于多特征的文本定位方法研究.docVIP

  • 3
  • 0
  • 约2.62万字
  • 约 30页
  • 2022-04-05 发布于浙江
  • 举报
摘  要 图像文本定位是基于内容的图像分析任务的重要前提,是文本识别的基础。实现自然场景图像中文本的准确定位,有着非常重要的实际意义和应用前景,同时由于自然场景文本的背景往往比较复杂,这给检测与定位带来诸多困难,目前已成为数字图像处理、计算机视觉领域的研究热点。 本文根据场景文本颜色一致、字符大小一致,以及笔画宽度稳定的特征,基于最大稳定极值区域MSER理论以及支持向量机SVM方法,提出了一种基于多特征的自然场景文本定位方法。该方法首先提取图像中的最大稳定极值区域,而后沿着边缘梯度方向增长得到的裁剪蒙版,并对MSER区域进行裁剪;然后针对裁剪后图像进行连通域分析,再用先验性知识规则对连通域进行筛选与合并,得到候选文本区域;最后利用多特征融合方法训练支持向量机SVM分类器,并使用SVM分类器再对候选文本区域进行分类,从而得到最终的定位文本区域。 本文算法使用ICDAR2011自然场景文本数据集进行测试,测试结果为召回率50.79%,准确率68.49%,综合指标f为58.33%。试验表明,本文提出的文本定位方法可以较准确地定位出场景图像中的文本区域,具有一定的实用参考价值。 关键词:文本定位;最大稳定极值区域(MSER);支持向量机(SVM);连通域分析 ABSTRACT Locating text in images is an important prerequisite for

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档