基于Python的图片文字识别.docxVIP

  • 62
  • 0
  • 约2.73千字
  • 约 4页
  • 2016-12-05 发布于重庆
  • 举报
基于Python的图片文字识别

基于Python的图片文字识别 【摘要】在有些工程中,有时候我们需要对图片文字识别。本文利用Python,调用OpenCV库,先对图片进行预处理,然后借助Google开源的pytesser对图片文字进行了识别。【关键词】:OpenCV,pytesser,文字识别一 关于OCR光学字符识别(英语:Optical?Character?Recognition,?OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。一般包括以下几个过程:图像输入、图像前处理、预识别:1 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有OpenCV、CxImage等开源项目。2 预处理:主要包括二值化,噪声去除,倾斜较正等。2.1二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地识别文字,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。2.2噪声去除:对于不同的文档,我们对噪声的定义可以不同,根据噪声的特征进行去燥,就叫做噪声去除。3 倾斜校正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。4版面分析:将文档图片分段落,分行的过程就叫做版

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档