基于连通区域矩阵的文本图像识别方法-信息工程大学学报.pdf

基于连通区域矩阵的文本图像识别方法-信息工程大学学报.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于连通区域矩阵的文本图像识别方法-信息工程大学学报

信息工程大学学报 Vo l. 13 No.3 第 13 卷第 3 期 2012 年 6 月 Journal of Information Engineering University Jun. 2012 DOI: 10. 3969/j. issn. 1671- 0673.2012.03.015 基于连通区域矩阵的文本图像识别方法 郭晓宇,平西建,周 林 (信息工程大学信息工程学院,河南郑州 450002) 摘要:如何从海量的图像里将文本图像挑选出来是网络图像处理领域的研究热点。为了达到 更好的文本图像识别效果,文章从文本图像的文字特征出发,提出了一种基于连通区域矩阵的 文本图像识别方法。首先对图像进行二值化,计算二值化后图像的连通区域矩阵,然后根据连 通区域矩阵提取出图像的 8 维特征值,最后使用 BP 神经网络来对图像进行训练和识别。实 验证实,该方法在保证较高识别率的同时,明显降低了误识率。 关键词:文本图像识别;图像分类;连通区域矩阵;BP 神经网络 中图分类号:TP39 1. 1 文献标识码:A 文章编号:1671-0673(2012)03喃 0329- 05 Document Image Recognition ßased on Connected Region Matrices GUO Xiao-yu , PING Xi-jian , ZHOU Lin (Institute of Information Engineering ,Information Engineering University , Zher耶hou 450002 ,China) Abstract: How to pick out document images from mountains of images has become a hot spot in net- work image processing. To recognize document images more efficiently , by analyzing the text charac- teristics of document images , a new method based on connected region matrix is proposed. Firstly , the connected region matrix of the binary image is obtained by image thresholding. Secondly , eight- dimensional characteristics are extracted from the connected region rectangle frame matrix of the im- age. Finally , a BP artificial neural network is used to recognize document images. Experiments demonstrate this method leads to reduced recognition errors. Key words: document image identification; image classification; connected region matrix; BP artifi- cial neural network 0 引言 随着多媒体技术和互联网技术的快速发展,数字图像的数量以惊人的速度增长,各种类型及内容的图 像随处可见。在这些图像中有一类是以文字、表格等为主要

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档