基于Python的图片文字识别.docxVIP

下载本文档

62
0
约2.73千字
约 4页
2016-12-05 发布于重庆
举报

基于Python的图片文字识别.docx

基于Python的图片文字识别

基于Python的图片文字识别【摘要】在有些工程中，有时候我们需要对图片文字识别。本文利用Python,调用OpenCV库，先对图片进行预处理，然后借助Google开源的pytesser对图片文字进行了识别。【关键词】：OpenCV,pytesser,文字识别一关于OCR光学字符识别（英语：Optical?Character?Recognition,?OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。一般包括以下几个过程：图像输入、图像前处理、预识别：1 图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式，目前有OpenCV、CxImage等开源项目。2 预处理：主要包括二值化，噪声去除，倾斜较正等。2.1二值化：对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为了让计算机更快的、更好地识别文字，我们需要先对彩色图进行处理，使图片只剩下前景信息与背景信息，可以简单的定义前景信息为黑色，背景信息为白色，这就是二值化图。2.2噪声去除：对于不同的文档，我们对噪声的定义可以不同，根据噪声的特征进行去燥，就叫做噪声去除。3 倾斜校正：由于一般用户，在拍照文档时，都比较随意，因此拍照出来的图片不可避免的产生倾斜，这就需要文字识别软件进行较正。4版面分析：将文档图片分段落，分行的过程就叫做版

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

基于Python的图片文字识别.docxVIP