扫描仪的文字识别.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
扫描仪的文字识别? ??????????????????????????????编辑整理---迟宝山???????? ??????? ????借助扫描仪将文字内容以图片形式扫描存人电脑后,然后可利 用OCR文字 识别软件将图形中的文字直接识别为文字文档。一般扫描 仪驱动盘中都附送了 文字识别软件,目前市场上较常见的文字识别软件 有尚书、汉王、紫光、丹青等。 ?? 小提示:什么一叫OCR?OCR(Optical?Character?Recognition)的概念 产生是在1929年,由德国的科学家Tausheck首先提出。它可以将图形中的文 字转换为一个个的字元,并保留其格式,最后达成图像文档转成文字文档的目 的,免去重新打字输入的技术。我们接下来以“尚书七号”为例,介绍一下如 何对已扫描存人电脑中的图像文档进行文字识别。而其它文字识别软件 在使用上也基本相似,在使用时如有问题可多查看软件所带的帮助 说明。在作OCR识别时应以300dpi、黑白二值扫描,并适当调高亮度和 对比度。启动文字识别软件,单击尚书七号工具栏上的“打开”图标, 打开要进行识别的文档,此时便可在原图栏看到图像。 1、图象位置的校正 ?若扫描的图像文档方向有误,如没有水平,或者图像颠倒,我们可 以在常用 的文字识别软件中进行简单的修正。在菜单栏“编辑”便可在其下看到一些常用 得上的调节方式(如图2)如果图像是上、下颠倒,则可借助“旋转图像→左转 90度”(或者是“右?转90度”)来分两次完成修正。如果在对图 像进行修正时出现错误操作,可利用“编辑”菜单下“恢复原图”来进行恢复。 如果扫描得到的图像出现轻微的倾斜,我们除利用“自动倾斜校正”来进行修 正外,还可选择“手动倾斜校正”?来进行。在进人手动倾斜校正后, 可将指针移到“手动倾斜校正”窗口图像上(不能在红色横坐标上),然后按住鼠 标左键,并移动鼠标,这样便可调整该窗口显示的内容在手动校正时除了可单击 右侧的??“顺时针”或“逆时针”两个按钮外,还可将指针移到红色横坐标中的小方 块上,按住鼠标左键上下移动鼠标,使得水平线条与 文本图像的倾斜角度一致(也可以用键盘上的上下箭头在按钮间切换),校正好 后单击“确认”按钮便可进行校正 (如图3,) 2.需识别的文字选取 在我们实际识别时并不需对整个图像文档进行识别,因此在识别前我们可以进 行范围选取,使图像中的图像、页码等不需要识别进来的内容排除在外,这 样能提高我们的正确识别率。 ??????小提示:若当前图像文档有比较规则的、不需识别的内容,可在工具栏上选 择“恢复鼠标”按粗,然后再将光标箭头移动到当前图像边框处,此时箭头变为 卡住围像边框的双箭头。按下鼠标左键,将该位置的图像边框向内一移动,使 边框只选择当前图像需识别的部分。 ??????在尚书七号中,可在工具栏单击“版面分析,,图标(或者直 接在键盘上敲F5快捷键),此时软件会自动对文档进行版面分析,并会自动根据 文档来划分方块,每个方块上都有一个数字,此数字表示识别时的排队等待编号, 有些类似于去银行办理业务时领取的号码。若框切分不对,可单击需取消的框,?? 操作方法为单击“识别”菜单中的“取消当前栏”命令,取消当前栏重新画框; 若整页切分错误较多,可单击工具栏中的“取消版面分析结果”按钮,取消图像 页的全部版面分析。一般我们可以采用手动选取的方法:直接在图像上按下鼠标 左键,拖动鼠标产生方框,使方框正好框住需识别的文字内容后,再松开鼠标 左键,这样便可产生第一个识别区。按照这种方法便可将图像上其它需识别的内 容范围逐个进行选取(如图4)。如果选择范围时次序有错(这样会使识别得到的 文字结果次序产生错误),我们可进行调整。把指针移到需移前的方框上,按下 鼠标左键,拖动鼠标此时会出现一个箭头图标,使它指向另一个需交换次序的方 框上,然后松开鼠标左键,便可使两个方框的序号进行互换(如图5)。 ??????小提示:要使两个方框的序号进行交换,除按上面的操作外,还得注意是从 大号方框上按下鼠标左健,使箭头‘指向一个比此方框号要小的方框上时,才会 进行序号交换。 ??????3.文字的识别及修改 ??????完成范围选择之后,单击工具栏上的“开始识别”图标便可进行 ??????快速识别。完成识别后,结果会出现在“文字识别显示栏托,在移动光标时会 ???????显示相应的图形内容,我们可以根据删除、输人或修改操作,注意最上面会显示 ???????可备选的文字或符号,我们可以对菜单进行设置(如图6)其中在识别结果中红色 文字多为出错内容。 小提示:在操作时注意识别软件窗口右下端的状态,为“插入”时不会影响

文档评论(0)

ktj823 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档