- 62
- 0
- 约2.73千字
- 约 4页
- 2016-12-05 发布于重庆
- 举报
基于Python的图片文字识别
基于Python的图片文字识别 【摘要】在有些工程中,有时候我们需要对图片文字识别。本文利用Python,调用OpenCV库,先对图片进行预处理,然后借助Google开源的pytesser对图片文字进行了识别。【关键词】:OpenCV,pytesser,文字识别一 关于OCR光学字符识别(英语:Optical?Character?Recognition,?OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。一般包括以下几个过程:图像输入、图像前处理、预识别:1 图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式,目前有OpenCV、CxImage等开源项目。2 预处理:主要包括二值化,噪声去除,倾斜较正等。2.1二值化:对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的、更好地识别文字,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图。2.2噪声去除:对于不同的文档,我们对噪声的定义可以不同,根据噪声的特征进行去燥,就叫做噪声去除。3 倾斜校正:由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。4版面分析:将文档图片分段落,分行的过程就叫做版
您可能关注的文档
- 华工2011级大物上试题及其答案.docx
- 华电宁东一期10MWP光伏电站项目施工组织设计.doc
- 华科图形学上机实验报告.doc
- 单反入门教程菜鸟必读的9个入门问题.docx
- 单纤光缆接续考核技术纲要2011版.doc
- 单片机课程设计-触控调光灯.docx
- 单片机实现发光二极管的循环点亮控制.doc
- 南京大学信息分析第二次作业2016.docx
- 南农大2004年植物生理学考研试题.doc
- 南大土地评价学第一次作业.doc
- 游客对AI景点智能讲解系统语言多样性需求的研究课题报告教学研究课题报告.docx
- 2026年瑞典券商资管市场竞争策略报告.docx
- 2026年4月浙江省金华市义乌市宾王中学七年级下册英语校本作业新版(含答案).docx
- 教师数字素养培训激励政策与教育信息化教育改革路径研究教学研究课题报告[001].docx
- 计算机二级MS Office2026年真题高频考点真题押题卷含解析.docx
- 人工智能视角下区域薄弱学校课程资源整合与教学质量提升策略研究教学研究课题报告.docx
- 初中英语听力材料语速快慢对理解度影响对比研究课题报告教学研究课题报告.docx
- 小学生对英语绘本阅读的语音语调改善研究课题报告教学研究课题报告.docx
- 高中心理健康教学中情绪管理可视化教学实践课题报告教学研究课题报告.docx
- 国家智慧教育云平台促进家校共育的教育信息化对学校教育决策的影响研究教学研究课题报告.docx
原创力文档

文档评论(0)