- 6
- 0
- 约2.33千字
- 约 5页
- 2017-07-05 发布于湖北
- 举报
工具//原料//
Adobe reader /Adobe acrobat pro 软件
Solid Converter PDF 6 / 7 软件
ABBYY finereader 9 /10 软件
步骤//方法//
1 首先我们要明白这个转换出乱码是怎么回事?
我们先用Adobe reader 或者Adobe acrobat Pro 软件打开我们会出现乱码的PDF 文件,
然后,菜单栏,文件属性字体项 我们可以看到是不是文件内嵌了很多字体。
我们这里找了一个文件为例:
图中本文档中使用的字体就是文件内嵌的字体,由于PDF 文件是可以内嵌字体的,所以你
打开PDF 文件
的时候是先读取内嵌的字体,如果内嵌的字体没有,那么再读取你系统中的字体来显示,然
而WORD
文件是直接读取系统中的字体的,那么如果你PDF 文件中内嵌的某个或者某些字体在你的
操作系统中
没有,那么转换出来的word 文件一般都会出现乱码。
2 知道了转换后为什么会出现乱码以后, 现在我们找一个转换软件来测试转换结
果,这里我们用AnyBizSoft PDF Converter 2.5 测试。
转换完毕后我们打开得到的word 文件看看会不会是乱码?
我截取了其中一个典型的页面,大家可以看看和 PDF 原文的对比,转换成word 后是一堆
乱码。
3 接下来我们换一个转换软件,我们使用Solid Converter PDF 6 / 7 软件。
这款转换软件是灰常强大的一个PDF 转换软件,转换效果很好,而且版面也保持的很好。
而且在以前
转换的使用过程中发现这个软件可以自动替换一部分PDF 内嵌的字体,从而达到解决一些
转换文件的
乱码问题,但是这个软件不是能够解决所有的乱码问题,有时候转换出来的还会是乱码。
比较惊喜的发现,用这个软件转换出来的虽然没有原文那样整齐,但是确实已经不是乱码了。
如果你用这个软件处理出来不是乱码了,那么我们的目的就达到了,如果用这个软件转换出
来还是乱码
那么我们接着往下看。
4 如果Solid Converter PDF 搞不定的话, 那么我们就只能用ABBYY finereader
这个软件对这个PDF 进行OCR 识别处理了。
软件界面的设置如下图:
转换的过程:
如果中间出现错误什么的,会有提示的。
转换完毕后我们打开转换好的WORD,截图,大家看效果:
效果还是相当不错的~~~ 乱码解决了~~~ 效果甚至比Solid Converter PDF 还好。
ABBYY finereader PDF WORD
ABBYY finereader PDF WORD
总结:AABBBBYYYYffiinneerreeaaddeerr 几乎可以解决所有PPDDFF转WWOORRDD乱码的问题,只要文件清晰
OCR ABBYY finereader
OCR ABBYY finereader
度可以的话。OOCCRR识别软件市面上有很多很多,但是AABBBBYYYYffiinneerreeaaddeerr的混合识别能力
~~~~ ~~
~~~~ ~~
和版面的保持能力是我见过的最好的~~~~~~~~所以推荐个大家~~~~
注意事项
OCR
OCR
OOCCRR识别存在着一定的错误率,这个和被识别文件的清晰度,分辨率有关系,文件分辨率
ABBYY finereader
ABBYY finereader
高,清晰度好,准确
您可能关注的文档
最近下载
- 常州大学《大学英语一》2024-----2025学年期末试卷(A卷).pdf VIP
- 艾米克变频器AMK3100中文说明书使用手册.pdf
- 必背古诗词75首(可打印) .pdf VIP
- 某知名汽车维修企业员工手册范本.docx VIP
- 2025年二建水利b证考试真题及答案.docx
- 安全驾驶教育培训课件.ppt VIP
- 汽车维修车间员工职责手册.docx VIP
- 黑龙江省哈尔滨市第三中学校2025-2026学年高二上学期9月月考物理试卷.docx VIP
- 初中语文名著导读--《骆驼祥子》知识点总结归纳.docx VIP
- 实施指南(2025)《DAT 22-2015 归档文件整理规则》.pptx VIP
原创力文档

文档评论(0)