[理学]多媒体素材的获取和处理.docVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[理学]多媒体素材的获取和处理

第三章 多媒体素材的获取和处理 第一节 文本素材的获取和处理 一、文本概述 文本是文字、数字和符号的统称,是最常用也是最基本的多媒体素材。文本主要用于对知识的描述性表示,如阐述概念、定义、原理和问题,以及在用户界面中显示标题、菜单等内容。用文本表达信息给人以充分的想象空间。文本素材通常以文本文件保存,常见的格式有:*.txt文件、*.doc文件、*.rtf文件、*.wps文件等。 二、文本的输入 文本的输入通常使用键盘,也可以采用手写输入、语音输入和扫描输入。用键盘输入时,英文、数字、常用标点符号可以直接从键盘输入,汉字、中文标点符号、其它文字符号、特殊符号的输入,通常需要使用相应的输入法。 文本中的特殊符号可通过输入法所提供的软键盘输入功能输入。例如,要输入○☆△←◎等符号,可在智能ABC输入法的工具栏的软键盘按钮上右击,在弹出的快捷菜单中选择“特殊符号”菜单项,再在弹出的软键盘中输入相应的符号。 利用特殊的字体设置还可以输入一些图形符号,如利用Webdings字体可输入?????????????????等图形符号,????????????????等符号。 用手写输入、语音输入和扫描输入等方法输入文本时,一般都要进行识别转换才能变成所需要的文本。 三、OCR文字识别技术 要将大批量的印刷体或手写体文字转换成电子文本素材,常用的方法就是通过扫描仪扫描后,再使用OCR文字识别技术将其识别转换为电子文本。OCR是Optical Character Recognition的简称,即光学字符识别技术。随着扫描仪的普及,OCR文字识别技术也日益成熟。许多OCR软件不仅能识别黑白印刷体汉字,还能识别灰度和彩色印刷体汉字,识别速度很快,识别正确率达到了99%以上;可识别宋体、黑体、楷体等多种字体和简体、繁体;可对多种字体、不同字号的混排进行识别;有些OCR软件还能识别图像、表格。与此同时,对于手写体汉字识别的研究也取得了很大进展,正确识别率已达到了70%以上。 常用的OCR文字识别软件有:中文OCR主要清华紫光OCR(7.5专业版,2000版,2002版等)、汉王OCR、中晶尚书OCR、丹青OCR、蒙恬OCR等。英文OCR主要有OmniPage清华紫光OCR(2002版)对扫描后的图像进行文字识别 1、打开清华紫光OCR2002版(默认安装位置:C:\Program Files\TH-OCR XP)。在文件菜单中选择打开菜单项,在打开对话框中选择扫描后的图像文件sampleJT3.tif,如图3-1-1所示。单击加入按钮后,得到如图3-1-2的结果。 2、倾斜矫正 自动校正:执行【命令[C]】菜单中的【倾斜校正[W]】或用鼠标选择工具条中的倾斜校正按钮,系统会自动将倾斜的图像校正。 按压鼠标左键在倾斜的图像中拉出一块大小适当的区域,再选【命令[C]】菜单中的【倾斜校正[W]】或用鼠标选工具条中的【倾斜校正】,系统会自动将倾斜的图像校正。 手动校正:按住Shift键,然后在要识别的图像的某一行文字下按下鼠标的右键并沿文字拖动使拉出的直线平行于倾斜的文本行,松开右键,系统会自动将倾斜的图像校正。    3、版面分析 在【命令[C]】菜单中,选【版面分析[L]】项(也可以直接按【F6】键),或用鼠标按工具条中快捷键,图像自动分为若干个属性不同的区域(图形图像、竖排文字、横排文字、表格等)。 4、设置版面区域类型 TH-OCR 2002 专业增强版系统的版面区域共有四种类型,即横排正文、竖排正文、表格和图形图像。在进行识别前必须正确定义图像中各区域的区域类型。 设置版面区域类型的方法是:对于所划分的每一个当前区域,在【图像[I]】菜单中选定相应的项目(【横排正文】、【竖排正文】、【表格】或【图形图像】);或直接用鼠标按工具条中的类型按键。 5、选择正确的识别字体 用鼠标打开工具条上的字体选择键,选择简体多体(印刷体)。或者先选择某一版面区域,然后单击鼠标右键,在快捷菜单中选择设置区域字体,选择简体多体(印刷体)。 6、文字识别 在【命令[C]】菜单中,选【识别[R]】项(也可以直接按键盘上的【F2】键),或用鼠标按工具条的识别按钮,系统即进入识别程序。识别过程中在识别输出窗口将出现一活动蓝条以报告识别完成的进度。识别后的文本内容存储在安装目录下的同名文本文件中,即在C:\Program Files\TH-OCR XP文件夹下的sampleJT3.TXT文件。 7、校对文本 完成识别后,点击工程管理窗口中相应的sampleJT3.TXT文本文件进入编辑修改状态。所获得的文本导出进行保存,选择“文件[F]”下“导出[E]”命令或工具条键,弹出对话框如图选择保存路径,键入文件名【导出范围】:选择【所有页导出为一个文件】时,系统把所有识别结果合并导出。【启

文档评论(0)

jiupshaieuk12 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档