- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
各种电子图书馆文章转为 Word 文档的方法
各种识别软件对电子图书馆文章的识别各有缺陷,有的只能识别字,对表格和图形无能为力;
有的识别后生成的版面乱七八糟,无法使用。还在为不同格式的文件怎么变成 Word 文件发愁吗?现
在好了,本文给出了所有情况下全文件表格、图形、文字识别的完美解决方案,帮助大家掌握正确
方法,节省时间:
1、PDF 文件的识别
1)文件可以直接识别的( 以文本形式保存的PDF 文件) :安装acrobat 7 专业版,注意不是 acrobat
reader ,直接另存为rtf 文件(识别整个文件) ,或者选择工具栏上的文字选择按钮,然后选择文字区域,
然后复制到 Word 等中。
2)文件不能直接识别的( 以图片形式保存的PDF 文件) :安装office2003,并装上 office 工具
Microsoft Office Document Imaging(完全安装此工具) ,然后在打印机里面会增加Microsoft Office
Document Image Writer 打印机,然后将 PDF 文件打印到此打印机,选择打印形成的文件的保存位置,
然后会自动形成一个 MDI 文件,并且自动用 Microsoft Office Document Image 打开此文件,然后选择
“工具”菜单下的“使用 ocr 识别文本”,识别完成后,在选择“工具”下的,“将文本发送到 Word” ,最后
将把整个 PDF 文件识别输出到 Word 文件中。
注意:Microsoft Office Document Image 可以非常准确的全文件识别转化中文、英文、表格,但
是无法将图形输出到 Word ,而是把文件中的所有图形单独形成一个个独立的图片文件,放在相同位
置的一个相同名称的文件夹中,因此可用 snagit 软件将图形打开,然后复制到 Word 中。(所有的识
别软件都不能很好的处理图形的识别问题,Microsoft Office Document Image 的这种处理方法已经是
非常好的解决这个问题了。)
3)加密的 Pdf 文件:先下载解密软件,解密后在参看 1),2)
4)繁体 pdf 文件:用 2) 的方法识别到Word 后,用 Word 中的“工具”--“语言”“ 中文繁简转换”
2、caj 文件的识别:
1)局部文字识别:直接使用 caj 浏览器的 ocr
2)全文件识别:打印到 Microsoft Office Document Image Writer 打印机,后面和上面的 2)操作一
样
3)博硕论文全文下载:在线阅读博硕论文,待可以看到最后一页后,不要关闭 caj 浏览器,到 caj
安装目录下 cache 中找到一个较大的文件,拷贝到其他位置即可。然后使用2)全部转化为 Word 。
3 、超星文件的识别:
1)局部文字识别:直接使用超星浏览器的 ocr
2)全文件识别:打印到 Microsoft Office Document Image Writer 打印机,后面和上面的 2)操作一
样,要注意的是,超星打印功能有点区别,因为超星是目录和全文分开的,所以打印时,需要分别
把目录和正文识别到 Word 中,在合并到一起。打印时要填入打印页码从 1 到最后一页,不要选择打
印全部。此外在打印选项中,还要将页面比例设成真实大小,而不是整宽。注意:识别速度比其他
格式要慢很多,请保持耐心,但是最后当你看到轻松的生成全本书的 Word 版本时,你会欣喜若狂的,
呵呵。我的试验结果是一本 280 页的书,识别需要几分钟的时间。
3)超星相对比较麻烦一些,如果还有问题,可以先把超星打印成完整的 pdf 文件,然后在用 1、
的方法转成Word
4、其他情况下的识别:
使用 snagit 软件将任何形式的文字可以变成图片,例如使用 snagit 将屏幕拷贝成图片,然后右键
点击图片文件,用 microsoft Office Document Image 打开图形,其他和 2)一样。
注意:其他的各种识别软件请不要在用,因为要么只能识别中文,要么只能识别英文,要么不
能识别整个文件,要么不能识别屏幕拷贝图像,要么识别误差很大,要么不能识别表格,要么需要
注册,要么识别速度很慢,要么使用不便(和 Word 结合不紧) ,这些软件包括:紫光 ocr,万方pdfocr ,
尚书,汉王,ScanSoft PDF Converter,pdf2Word ,以及各种被推荐的软件
您可能关注的文档
最近下载
- 【大学课件】电子商务案例分析.ppt VIP
- DL∕T 793.2-2017 发电设备可靠性评价规程 第2部分:燃煤机组.pdf
- 一种多酚类化合物和组合物及其在制备具有抗衰老作用的产品中的应用.pdf VIP
- 一种TA@LS-Ag复合物及其在制备具有抗衰老作用的护肤品、化妆品或药物中的应用.pdf VIP
- Walkera华科尔无人机FCS-F8使用指南_CN_V1.2_2020.10.12(金属壳版).pdf
- 老年人居家适老化改造工程竣工验收单(参考模板)(2022年参考新格式).docx
- 人教版(2024)七年级英语上册Unit 7 Happy Birthday Lesson 1课件+音频(共20张PPT).ppt.pptx VIP
- 中试平台管理制度.docx
- 北京市清华附小2023年四年级数学第二学期期末监测模拟试题含解析.doc
- 《化妆品配方与制备技术》课件——第7章 造型用品.pptx VIP
文档评论(0)