- 2
- 0
- 约1.54千字
- 约 5页
- 2017-05-13 发布于四川
- 举报
图片文字提取方法全集
光学字符识别技术OCR(Optical Character Recognition的简称),是自动识别技术研究和应用中的一个重要领域,我们识别图片中的文字,用的就是OCR技术。
目前有很多OCR识别软件,例如Office Document Imaging、汉王OCR,清华紫光OCR、尚书6号等等。但需要注意,通常OCR软件只能够识别比较规范的印刷体,手写文本目前在识别上仍有困难。
下面简单介绍一下几款OCR识别软件及使用方法。
方法一、利用Office Document Imaging 提取文字
Office在2003版中增加了Document Imaging工具,用它可以把文字给“抠”出来。注意:Microsoft Office Document Imaging不是Office 2003默认的安装选项,初次启用时,如果该组件未安装,则需要插入Office的安装光盘进行安装。
使用方法
1、在“文件”中打开图片,若是提取扫描仪中的印刷品文字,选择“扫描新文档”,即可将印刷品的文字扫描到电脑上。
2、工具--使用OCR识别文本,OCR识别程序就会对图片进行识别,完成后选择:工具--将文本发送到Word ,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。
注意事项
1、若图片中是英文,可在工具--选项--OCR--OCR 语言,选择english,再进行识别。
2、Office Document Imaging只支持MDI、TIF等图片格式。如需识别其他格式的图片,需要利用图片处理软件转换一下,或者利用Office Document Imaging组件中的“Microsoft Office Document Imaging Writer”的虚拟打印机,将图片打印成一个MDI文件,然后再进行识别。
方法二、使用文字识别工具提取文字
1、清华紫光OCR用法简介
1)打开带有文字的图片,根据所要提取的文字进行裁剪(如果是电子书籍,可按下“Print Screerl”屏幕捕获键将其保存为图片)。
2)启动紫光OCR,打开已裁减的图片,用鼠标在图片中绘制出待识别的文字区域,按下工具栏“识别”按钮即可。文字识别结束后,会自动在一个文本编辑器中打开已提取文字,将结果复制粘贴至其他文档中即可。
2、尚书六号用法简介
1)进入尚书六号的界面,界面如下:
2)导入需要提取的图片,点击文件,选择打开图象页
选择刚才保存的sample.jpg并点击打开
3)点击识别,开始进行识别
尚书六号自动识别的三个选框
4)提取文字并保存文本
不修改默认设置,直接点击识别后,弹出的界面
将框内的文字选中,并复制到文本文件或Word文档进行个别错字修正即可。
方法三、使用截图工具Snagit 提取文字
现在许多网站都有EXE、CHM、PDF等格式的电子书下载。很多时候这些电子书可以看,但是其中的内容却不能复制。如果我们需要这些电子书中的文本内容,是不是就非得要重新输入一遍呢?当然不用这么麻烦。下面我就告诉大家如何将这些内容从资料中提取出来。
Snagit提取文字方法
Snagit是一款功能强大的图片捕捉工具,它还有文字捕捉的功能,能将文字从图片中提取出来。目前它的最新版本为7.0。启动Snagit 7.0,在左侧选中“窗口文字”,在左侧选择输入位置(比如屏幕、区域、窗口等),输出位置(比如打印机、剪贴板、文件等)。设置完成后,.回到要捕捉文字的文件窗口,按下“捕获”快捷键,即可将文字提取出来。
如果发现提取的文字中,有很多空格或出现段落错乱等情况,可用文字编辑工具进行重新编
您可能关注的文档
最近下载
- 2025年轻型民用无人驾驶航空器安全操控(多旋翼)理论备考试题及答案.docx
- 《煤矸石集料在制备建筑砂浆中应用指南》.docx VIP
- 高中语文文言文300实词+18虚词.pdf VIP
- 2023-2014年生猪养殖行业(申万Ⅲ)比率、现金流、发展、盈利、经营、偿债能力均值.doc VIP
- 无人机飞行管理.pptx VIP
- 2024《中班幼儿饮食行为现状调查—以S幼儿园为例》12000字.docx VIP
- 林业标准地调查表格.docx VIP
- 2026年高考第一次模拟考试:地理一模突破卷01(新高考全国通用)(考试版).docx VIP
- 标准地调查方法与原则.pptx VIP
- 专题03功能中的图像问题(共12种图像类型)讲义-2025版高考物理图像专题.pdf VIP
原创力文档

文档评论(0)