第2章文字素材采集与处理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章文字素材采集与处理

网络多媒体素材加工 .1. 第2章 文字素材采集与处理 第2章 文字素材采集与处理 2.2 使用OCR工具软件转换图像文字 (实训2 ) 2.3 语音识别与手写输入技术(实训3) 2.2 使用OCR工具软件转换图像文字 2.2.1 扫描仪 2.2.2 工具软件 2.2.3 OCR处理实例 2.2.1 扫描仪 扫描仪的分类 按扫描原理分类,可将扫描仪分为平板式扫描仪、手持式扫描仪和滚筒式扫描仪; 按操作方式分类,可分为手持式、台式和滚筒式; 按色彩方式分类,可分为灰度扫描仪和彩色扫描仪; 按扫描图稿的介质可将扫描仪分为反射式(纸质材料)扫描仪,透射式(胶片)扫描仪以及既可扫描反射稿又可扫描透射稿的多用途扫描仪。 2.2.1 扫描仪 扫描仪的主要性能指标 (1)分辨率 (2)色彩位数 (3)灰度 (4)速度 (5)幅面 2.2.2 OCR工具软件 Microsoft Office 2003中的OCR组件 汉王文豪5800 清华文通TH-OCR 9.0 4.慧视小灵鼠 1.Microsoft Office 2003中的OCR组件 Microsoft Office 2003中的OCR组件包括:Microsoft Office Document Scanning(文件扫描)和Microsoft Office Document Imaging(文件成像)。 Microsoft Office Document Scanning:可通过联机的扫描仪将纸质文档扫描到计算机。 Microsoft Office Document Imaging:便于用户在屏幕上查看扫描的文档、重排多页文档、选择识别的文本并对其进行操作、向扫描的文档和电子传真添加注释以及通过电子邮件或传真向其他人发送文档。 1.Microsoft Office 2003中的OCR组件 在Microsoft Office Document Imaging中,可按MDI格式和TIFF文件格式打开和保存文件,并可对两种格式的图像文字进行光学字符识别(OCR),将图像文字转换为文本文字。 2.汉王文豪5800工具软件 文豪5800除了具备文本王经典版的各项功能,诸如操作简单快捷、一键即可实现扫描识别输出到Word文档外,它还能准确识别各种表格和图像,并新增加了批量工程处理、表格拼接、ACDSee图文索引和摘抄高手等人性化的功能设计。 3.清华文通TH-OCR 9.0 TH-OCR是清华大学自1985年就开始研发的,在国家“863”计划支持下,持续了十多年的研究成果。 TH-OCR 9.0真正实现了汉英混排同时识别,突破了OCR产品只能处理汉字或英文单一文字的局限性,新增了东方文字(简繁汉、日文、韩文)识别功能,对日文和韩文与英文混排文档的识别水平甚至超过日本和韩国对本国文字的识别水平。 4.慧视小灵鼠 慧视小灵鼠屏幕文字识别系统可以从数码相机等各种设备摄取的图片中识别文字信息;联机手写文字识别系统,可以脱离手写板的限制任意书写文字。慧视小灵鼠包括屏幕取字和鼠标手写输入等新技术。 其它较常用的OCR工具软件有尚书OCR、汉王OCR、蒙怡OCR、丹青OCR等。 实训2 图像文字素材的扫描输入、转换与编辑 目的:了解文字素材扫描输入的基本原理,掌握扫描仪的安装和使用以及OCR工具软件使用方法。 内容:扫描仪的正确安装,完成一页图像文字素材的扫描输入,要求使用OCR工具软件进行转换,形成文本格式文件。 要求:正确使用扫描仪,熟悉OCR工具软件的使用方法,能独立完成图像文字素材的扫描处理。实训完成后,必须保存结果文件。 2.3 语音识别与手写输入技术 (1) 概述(语音、手写识别技术介绍) (2) Microsoft Office语音输入和手写输入组件安装 (3) Microsoft Office语音、手写识别工具使用 (1)概述 1.语音识别技术 语音识别技术就是让机器通过“理解”和识别把语音信号转变为相应的文本或命令的技术。 语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。 (1)概述 2.手写识别技术 手写识别技术是指通过手写板等轨迹捕获设备获得书写者的书写信息,将手写字转换输入计算机。 用户在手写板和触摸屏上书写的笔画以类似于矢量图的形式被计算机存储下来,通过对文字图像的抬笔、落笔、笔迹上各像素的空间位置等信息进行处理与对照,系统将数据转化为计算机所使用的文字代码进行输出。 (2)Microsoft Office语音输入和手写输入组件安装 语音识别和手写识别的软件很多,如语音输入王、清华紫光手写输入系统等,这里主要介绍Microsoft Office 2003语音输入和手

文档评论(0)

ldj215322 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档