- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
如何把纸质文件通过扫描转化成word文档巧用Office 2003实现OCR文字输入
巧用Office 2003实现OCR文字输入
为了迎接市里的工作验收,领导拿来了许多存档文件,要求小王在三天内摘录并形成汇报文档。看着厚厚的材料小王发愁了,这时有人提醒:你的笔记本电脑不是刚装上Office 2003吗,里面的Microsoft Office Document Imaging不错。它是一个光学字符识别(OCR)软件,可以用扫描仪扫入纸文档中的汉字,用它,摘录文件的速度可快多了。
○ 操作准备
局里只有一台比较旧的F1210扫描仪,小王把它连接到笔记本电脑的并口,接通电源以后安装扫描仪驱动程序。单击“开始”--“所有程序”--“Microsoft Office工具”中的“Microsoft Office Document Imaging”,将纸文档放入扫描仪,准备将其中的汉字输入Word。
○ 扫描设置
打开Microsoft Office Document Imaging窗口以后,单击工具栏中的“扫描新文档”按钮,即可看到如图1所示的对话框。首先单击其中的“扫描仪”按钮打开选择扫描仪对话框,查看当前扫描仪的型号是否在里面。如果对话框或下拉列表中没有当前扫描仪,就要检查驱动程序安装和电源连接是否正确。
接下来要根据文档的特点选择扫描预设。如果是彩色纸张上的黑色或彩色文本,或者是白色纸张上的彩色文本,可以选择“将彩色页面扫描为黑白图片”;对常见的白色纸张上的黑色文本而言,可以选择“黑白模式”或“灰度模式”。
Microsoft Office Document Imaging提供的扫描预设功能可以满足大多数文档的要求。如果文档使用的字体太小,或者由于纸张等缘故导致文字不太清楚,就得适当调整扫描预设中的分辨率。用户只要选中要调整的某种扫描预设,单击图1中的“预设选项”按钮打开菜单,选择其中的“编辑所选预设”,就可以看到“预设选项”对话框的“常规”选项卡。单击其中的“高级”按钮打开如图2所示的对话框,可将默认的分辨率(DPI)值由200修改为300。当扫描文档中的文字是彩色或具有彩色背景时,选中图2中的“自动设置对比度,保存为单色”,让扫描的图像具有较高的对比度,这样可以获得更好的文字识别效果。
除此之外,“预设选项”对话框还有三个选项卡。其中“页面”选项卡设置扫描仪的幅面,常见的A4扫描仪应该选择“A4”(默认);“输出”选项卡可以设置扫描文件的保存位置,还可以设置扫描文件的命名方式,可以根据自己的需要进行调整;“处理”选项卡控制OCR的工作设置,一般采用其中的默认值就可以了。
○ 扫描文档
文档放入扫描仪以后,根据其特点选择图1中的某一个扫描预设方式,单击“扫描”按钮开始扫描文档。与大多数OCR软件不同,Microsoft Office Document Imaging扫描结束即开始文字识别,完成后即可在窗口中显示结果。
该窗口分为“缩略图窗格”和“页面窗格”左右两部分。如果用户连续扫描了多页文档,缩略图窗格显示各页的缩略图,页面窗格显示当前文档的图像。
如果用户有多页文档需要扫描和识别,可以在一页扫描结束后再次扫描下一页,完成后会弹出一个对话框。单击“继续”按钮可以放入下一页文档,继续进行扫描,但不识别和保存当前文档;单击“完成”按钮则停止扫描,执行识别并保存文件。再次扫描新文档时只要将它放入扫描仪,单击图1中的“扫描”按钮即可;单击“取消”按钮会停止扫描,不进行识别也不保存文件。
建议把“换页提示”也勾选上,这样可以一次用扫描仪扫描完诺干张纸质文件,然后统一识别转化成word文档,提高工作效率
小提示 Microsoft Office Document Imaging具有自动旋转功能,文档放入扫描仪时无论位置正、倒都可以,软件在扫描过程中会自动识别并旋转到正确的方位。
○ 获取文本
从表面上看,页面窗格显示的是文档图像。其实不然,被识别的文本已经被隐藏在层中了(与文档图像分离)。我们可以采取两种方法获取该层中的文本。
如果需要某页文档中的部分文字,只要按下工具栏中的“选择”按钮,拖动光标选中页面窗格中需要的文本,单击鼠标右键选择快捷菜单中的“复制”,就可以将这部分文本放入剪贴板,再粘贴到汇报文档中编辑了。如果单击工具栏中的“将文本发送到Word”按钮,软件就会自动新建一个Word文档,将所选中的识别文字放入其中。以上操作完成后,在页面窗格中的任意位置单击鼠标,就可以取消已经选中的文本,再次获取其它位置的文本了。(页面中既有文字又有图片,或者既有文字也有表格边框,识别效果可能会受到影响,建议先选中文字,再识别)
当需要某页或几页文档中的所有文本时,可以直接打开工具栏中的“将文本发送到
您可能关注的文档
- 如何制作安卓手机卡刷包教材教程 (2).doc
- 如何卸载手机软件.doc
- 如何在iMC中通过导入MIB方式自定义Trap.doc
- 如何在UG里标注汉字.doc
- 如何在一个月内把字写得又快又好看.doc
- 如何在旅行中给女友拍摄.doc
- 如何在白板中打开.doc
- 如何培养学生认读单词的能力.doc
- 如何填写《入党志愿书》.doc
- 如何完善不动产善意取得制度.doc
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)