- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
提取图片上的文字的方法
方法一、安装OCR软件,给您提一点小技巧,在使用OCR软件识别前,可用用图片处理软件(例如:photoshop)处理一下,转换成黑白模式,并适当加大对比度,可以大大提高识别率。Microsoft Office自带的识别(Document Imaging)和扫描功能(Document scanning)。
1、Microsoft Office Document Imaging(office2003中内含)OFFICE中有一个组件document image,功能一样的强大。不仅扫描的文字图片,连数码相机拍的墙上的宣传告示上的字都能提取出来。office安装文件第一步 tif格式。第二步 点“开始→程序→Microsoft Office→Microsoft Office 工具 ”,在 “Microsoft Office 工具” 里点“ Microsoft Office Document Imaging”
第三步 用 Microsoft Office Document Imaging打开图片,用OCR工具(图中红色筐圈部分)选取你要提取的文字,然后点右键,选择-复制到word或者记事本。用摄像头作扫描仪输入文字:“开始→Microsoft office→Microsoft office工具→Microsoft office Document scanning”,如果该项未安装,系统则会自动安装。
此时会弹出扫描新文件对话框,单击[扫描仪]按钮,在弹出的对话框中选中摄像头,并选中“在扫描前显示扫描仪驱动”复选框,再选中“黑白模式”,并选中“换页提示”和“扫描后查看文件”两项。再单击[扫描]按钮即可进行扫描,在扫描过程中会弹出一个对话框,选中[格式]按钮,在“输出大小”中选择600×480分辨率,然后将文稿放平,反复调节摄像头的焦距和位置,使画面达到最佳效果,点击[捕获]按钮即可得到图片画面,该图片会显示在“图例”框中选中该图片,点击[发送]按钮会开始扫描该图片中的文字,扫描完成后点[完成]按钮,然后系统会自动打开识别程序Microsoft Office Document Imaging,用该文件就可以识别了。完成后可以选中全文,鼠标右击后选中“将文本发送到Word”项,则所选内容便会被Word打开并可以进行编辑了方法三,用CAJViewer(中国知网用软件,免费)识别PDF,保存为doc格式。
软件:word2003 CAJViewer软件(是一款免费的阅读器)
AJViewer。
用CAJViewer打开需要识别的pdf文件,点选“文字识别”,选择识别区域,在出现的菜单中选择点击发送到word”按钮,就可以转换成word文件了可以编辑了AJViewer识别转换成可以编辑的文字。把图片转换成PDF格式的方法很多,此处介绍其一二(自己常用),用wps2012打开图片,然后“文件”--“输出为PDF文档”,选择保存位置,确定。如在Microsoft office2003中用word,得先安装如doPDF (免费软件,转换和打印PDF格式文档)等PDF转换软件。步骤:1、在word中,“新建”—“插入”—“图片”—“来自文件”—选择要识别的图片,确定。然后选“打印”,打印机选择“doPDF v7”,确定。然后选择保存位置。即转换为PDF格式。
文档评论(0)