- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* “尚书七号OCR”文字识别软件 01 * 3.文字输出 2.文字识别 01 “尚书七号OCR”文字识别软件 1.扫描图像 * 1.扫描图像 选择扫描仪 扫描界面 参数选择 * 2. 文字识别 自动倾斜校正 选择版面分析 版面分析后 选择“开始识别” 识别以后 * 3. 文字输出 * 任务拓展 02 * 02 任务拓展——运用OCR识别的技巧及注意事项 1.设置分辨率 分辨率的设置是文字识别的重要前提。大部分文档扫描,选择300DPI或400DPI的分辨率较为合适。 2.文本校正 计算机上显示的扫描文本可能不会与原件上的完全一样,特别是原件有模糊或涂污的文本时。例如,一些字符可能错误或缺失。编辑文本时,需要将扫描的文本与原件进行比较并做出必要的更正。 3.关于段落重排 在识别后文本的再处理时,将其复制粘贴到Word文档中,利用Word查找、替换功能来去掉多余的硬回车是较为麻烦的做法。尚书OCR、汉王OCR和紫光OCR都提供了段内去硬回车的功能。只需在识别后的文本存盘时,选“回车设置为软回车”就行了。或者选择“文件”菜单下面的导出命令,将存为类型选为“.txt”,而在“段内回车字符”处选“无”。 注意:一定不要直接存盘,否则就不能自动去掉文章的硬回车。 * 扫描仪的日常维护与保养 03 * 03 扫描仪的日常维护与保养 1.搬运扫描仪 搬运扫描仪前需要执行以下操作: (1)确认扫描单元是否处于初始位置。若未处于初始位置,将AC适配器连接至电源插座,使扫描单元完全返回到扫描仪的初始位置。 (2)从电源插座拔出AC适配器,并且从电脑上取下USB连线。 (3)将锁扣推到锁上标记,以便锁上扫描单元。若在提起或搬运扫描仪时未上锁,可能会损坏扫描仪。 2.清洁扫描仪 在通常操作状态下,可使用下列步骤以清洁黏附在外部、文件玻璃以及文件盖上的污物和灰尘。 (1)从电源插座拔出AC适配器,并且从电脑上取下USB连线。 (2)用蘸过水并挤干水分的软布轻轻擦拭文件盖及文件玻璃,以去除污物和灰尘。 (3)使用一块软干布擦净水分和水蒸气,对于文件玻璃,应擦拭去除任何污物或液体的痕迹。 清洁扫描仪时需要注意以下几点: (1)切勿使用含酒精、稀释剂或苯的物质清洁扫描仪,因为这些物质可能会使外壳变形、褪色或溶解。 (2)切勿将过于潮湿的布或直接将液体用于扫描仪的任何部分。若有水分流入内部文件玻璃的里面或传感器,会使图像质量劣化并导致故障。 (3)清洁时,切勿用力按压文件玻璃。 3.更换荧光灯 荧光灯的发光程度会逐渐降低,如果灯泡损坏或太暗,扫描仪会停止工作,荧光灯就会不亮。出现这种情况时,就必须更换灯泡。 * 常见的扫描仪故障与排除 04 * 04 常见的扫描仪故障与排除 1.扫描仪初始化或硬件问题 (1)重置扫描仪 (2)测试扫描仪硬件 (3)扫描仪不能正常工作 (4)开启扫描仪灯管不亮、亮度不均匀或预热时间过长 2.扫描仪操作问题 (1)扫描仪不能开启 (2)扫描仪不能立刻扫描 (3)扫描的图像模糊不清 (4)扫描速度非常慢 3.幻灯片、底片和透明材料适配器(TMA)等问题 (1)扫描的图像中出现斑点或条纹 (2)需要扫描的图像发黑。 4.扫描仪安装问题 (1)检查软件是否正确或者完整安装 (2)检查连线 * 小技巧 05 * 05 小技巧 改善文字识别效果的规律和技巧: 1.扫描时适当地调整好亮度和对比度值,使扫描文件黑白分明。这对识别率的影响最为关键,扫描亮度和对比度值的设定以观察扫描后的图像中汉字的笔画较细但又不断开为原则。 2. 选好扫描软件。选一款好的适合的OCR软件是做好文字识别工作的基础,相比较于扫描仪自带的文字识别软件,清华紫光OCR2003专业版和尚书OCR7.0文本自动识别输入系统的识别能力与使用功能更突出一些。 另外,选取Photoshop图像处理软件扫描接口扫描图像,后期利用OCR软件进行文字识别,会起到事半功倍的效果。图像的杂质、黑斑等可以先在Photoshop中进行处理。 3.手动选择扫描区域。设置好参数后,先预览,然后选取扫描区域。根据实际情况,按照字体、字号及排版的一致性将版面合理地划分区域并设定识别顺序,有助于提高识别率。 4.原稿的放置技巧。在放置扫描原稿时,一定要把扫描的文字材料摆放在扫描起始线正中间,以最大限度地减少由于光学透镜导致的失真。同时应保护扫描仪玻璃的干净和不受损害。文字有一定角度的倾斜,或者是原稿文字部分为
原创力文档


文档评论(0)