- 3
- 0
- 约 5页
- 2017-05-05 发布于北京
- 举报
从图片中读取文字_把图片转换成文本格式[用word附带功能就能做到]
超简单从图片中读取文字的方法(使用word自带软件)
(全文原创,转载请注明版权。本文下载免费,如果对您有一定帮助,请在右边给予评价,这样有利于将本文档位于百度搜索结果的靠前位置,方便本方法的推广)
【本文将介绍读取图片中的文字、读取书中文字、读取PDF格式文件中的文字的方法】
一、背景
看到图片中满是文字,而你又想把这些文字保存下来,怎么办?
日常读书,某篇文章写的极好,想把它分享到网络上,怎么办?
一个字一个字敲进电脑?太麻烦了。是不是希望有一种东西能自动识别读取这些文字?
是的,科技就是拿来偷懒的。
其实你们电脑中安装的word早就为你考虑过这些问题了,只是你还不知道。
二、方法
1、图片格式转换
只有特定格式的图片才能读取文字,所以要转换。大家常见的图片格式都是jpg,或者png,bmp等,用电脑自带的 画图 软件打开你要获取文字的图片(画图软件在 开始——所有程序——附件 中,win7用户直接右击图片,选择 编辑 ,就默认使用画图软件打开图片),然后把图片另存为tiff格式。
(以我的win7画图为例。另存为tiff格式如下图)
2、打开读取文字的工具
开始——所有程序——Microsoft Office ——Microsoft Office工具——Microsoft Office Document Imaging(本文全部以office2003为例。另外,有些人安装的是Office精简版,可能没有附带这个功能,那就需要添加安装一下,安装步骤见文末 注释① )
3、导入tiff格式的图片
在Microsoft Office Document Imaging软件界面中,选择 文件——导入,然后选择你刚才存放的tiff格式的图片,导入。
4、文字识别
点击下图橙色方框圈中的图标,进行OCR识别,就是让软件把图片中的文字读取出来(图片中文字越多,识别花费的时间越长,进行识别完成之后,左边缩略图框中会有一个眼睛的标志,如图红色箭头所指);点击下图橙色椭圆圈中的图标,就能将整个图片中的文本发送到word。
5、也可以选择图片中的部分文字。
首先还是要点击OCR识别(如果上面已经识别过,就不用再识别一次了,具体看有没有眼睛标志),然后点击下图中左上角菜单中的 箭头 ,就可以自由拖动选择文字、图片,右击选择框,就可以复制文本、图片或者将选中的文字发送到word。
6、展示一下识别效果
7、重要说明
一般来讲,图片清晰、对比鲜明的时候,该软件对文字的识别率在95%以上,但不能保证100%。为保险起见,还是要人工核对一下识别的结果,尤其是格式特别复杂、有特殊文字、特殊符号的地方。识别率与图片清晰度、文字大小、文字的端正程度、文字与底色的对比程度有关。不要指望你用肉眼都看不清楚或者不能分辨的文字可以用该软件识别出来。
该软件的原理是使用扫描的文本字符与系统内置的字符形状、语言辞典进行比较,从而识别文字,只能扫描指定的语言,其他语言不能识别。要更改使用的扫描语言,在“工具”菜单下——选项——OCR选项卡——OCR语言,选择你要使用的语言。一般默认使用的语言跟你word的默认语言相同,因此没有特殊要求,不必更改。
现在网上有许多这方面的专门软件(百度一下OCR就出来了),使用的基本原理都是OCR,但人家既然号称“专业”,可能功能更强大一些(比如支持更多语言)、识别率更高一些(具体是不是,我没用过,也不知道,感觉word自带的这个就够用了),而且,他们大都需要付费,我就看到一款在淘宝卖的,叫价69元(淘宝网址可以参见文末 注释②)。
三、其他读取文字的需要
1、读取书上的文字
可以把书上的文字用像素较高的相机照下来,注意照片要端正,尽量清晰,白纸黑字对比鲜明的照片最好,然后对照片执行以上操作。
2、读取PDF文件
用Adobe Reader 打开PDF格式的文件:
如果读取全文,在Adobe Reader中单击 文件——打印 ,将“打印机”设置为“Microsoft Office Document Image Writer”,单击打印,默认输出tiff格式虚拟打印文件(也可以设置为输出mdi格式的文件),然后对输出的tiff格式文件或者mdi格式文件执行以上读取文字的操作;
如果读取部分文字,翻到你需要的文字所在页面,摁下PrScrn键(有抓取屏幕图像的功能),然后打开Microsoft Office Document Imaging,在左侧窗口中单击右键,选择“粘贴页面”,就能把刚才PrScrn键抓取的整个屏幕粘贴到Document Imaging中,然后执行以上读取文本的操作。
需要说明的是,现在PDF转word,有更多更方便的方法了。一是现在大家使用的新版的Adobe Reader,其本身就能把pdf页面中的文字转换成文本文档;二是同
您可能关注的文档
- 主持人和歌手大赛策划书_新.doc
- 主持稿[主持人致辞和串场词].doc
- 主流2维动画软件介绍[最全].doc
- 主题阅读人教版8上“感悟人间真爱”.doc
- 为中国而设计-西方建筑大师和中国建筑.doc
- 举办关于“美丽校园”校园清扫志愿服务活动策划方案.docx
- 为梦想而活,为梦想而战-云南农业大学[suo金].doc
- 中考说明文阅读“从天而降片片雪花给人们带来欢乐”.doc
- 九年义务教育课本三年级第2学期[试用本]语文.doc
- 九12班冲刺家长会[14年五月].doc
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
最近下载
- 人教版三年级数学下册《口算除法》.ppt VIP
- 中华民族共同体概论课件专家版3第三讲 文明初现与中华民族起源(史前时期).pptx VIP
- 西南财经大学专题研究生考试参考书目.pdf VIP
- 中华民族共同体概论课件第十二讲民族危亡与中华民族意识觉醒(1840—1919)2025年版.pptx VIP
- 金属地下矿山安全教育培训课件.ppt VIP
- 第二学期八年级数学备课组工作计划.docx VIP
- 妇科护理宫腔镜进修总结.pptx
- 中华民族共同体概论大讲堂之第十二讲民族危亡与民族意识觉醒(1840—1919).pptx VIP
- 2025年度销售工作总结与2026战略规划.pptx VIP
- 《横县鱼生全链条管理规范 第1部分:养殖》.docx VIP
原创力文档

文档评论(0)