- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络多媒体素材加工 .1. 第2章 文字素材采集与处理 第2章 文字素材采集与处理 2.1 文字素材基础 2.2 使用OCR工具软件转换图像文字 2.3 语音识别与手写输入技术 2.4 文字素材采集实训 2.1 文字素材基础 2.1.1 文字素材采集与编辑 2.1.2 文字编辑常用工具软件 2.1.3 常用文本文件格式及其转换 2.1.1 文字素材采集与编辑 一般根据文字素材在计算机中的存储和显示方式不同,可将文字素材分为文本文字素材和图像文字素材两类。 文本文字是指以文本文件格式存在的文字素材,如TXT、DOC等格式的文本文字; 图像文字是指以图像文件格式存在的文字素材,如BMP、TIF等格式的文件。 1.文本文字与图像文字 2.文字素材的采集 键盘输入:通过键盘,可以将中文字、英文字母、数字、标点符号等输入到计算机中。 扫描输入:通过扫描仪将纸上的文字转换为计算机可处理的信息,一般用于大量文字的快速录入。 语音输入:语音输入设备向计算机输入信息的过程,包括命令控制和听写两个功能。 手写输入:用书写笔在与计算机相连的书写板上写字,用压敏或电磁感应等方式将笔在运动中的坐标输入计算机,识别软件根据采集到的笔迹之间的位置关系和时间关系信息来识别所写的文字,并把结果显示在屏幕上。 2.1.2 文字编辑常用工具软件 Windows 操作系统自带的编辑工具(记事本、写字板) Microsoft Word WPS Office 金山文字2003 2.1.3 常用文本文件格式及其转换 1.常用文本文件格式 2.DOC文件与PDF文件的格式转换 3.DOC文件格式与CAJ文件格式间的相互转换 1.常用文本文件格式 TXT格式:TXT是一种纯文本格式文件,可由记事本处理创建。 CSV格式:CSV(Comma Separated Values)文件格式也是一种纯文本文件,常用于不同应用程序之间交换数据,它可以被任何文本编辑器调用、编辑、修改。 1.常用文本文件格式 DOC格式:一种通用的PC格式化文本文件格式,由Microsoft Word或WordPerfect for Windows创建,可以包含更多的内容,建立超链接等,表现力强、操作简便。 RTF格式:RTF(Rich Text Format)格式是微软公司的写字板采用的标准格式。 1.常用文本文件格式 WPS格式:WPS文件是作为目前国内唯一较成熟的拥有完全自主知识产权的办公系统软件——WPS Office 生成的文本文件格式。 PDF格式:PDF(Portable Document Format便携式文档格式)文件格式是Adobe公司开发的电子读物文件格式。 CAJ格式:CAJ文件是《中国学术期刊全文数据库》的专用格式,由中国学术期刊(光盘版)电子杂志社开发制作。 2.DOC文件与PDF文件的格式转换 (1)DOC格式文件转换为PDF格式文件 将DOC格式转换为PDF格式比较容易,如果系统完全安装Adobe Acrobat 7.0 Professional,就可以通过下列方式进行转换: 使用“快捷菜单”进行转换 利用Acrobat PDF Maker 利用Acrobat PDF打印机转换 ① 使用“快捷菜单”进行转换 ② 利用Acrobat PDF Maker ③ 利用Acrobat PDF打印机转换 (2)PDF文件转换为DOC格式文件 ①直接从PDF文件复制文本到DOC文件 ②利用Adobe Acrobat自身转换功能 ③借助格式转换工具软件(ScanSoft软件) ④图像形式PDF文件的转换 ⑤利用CAJViewer的OCR功能 ① 直接从PDF文件复制文本到DOC文件 ② 利用Adobe Acrobat自身转换功能 Adobe Acrobat提供了PDF格式向DOC格式的转换功能。执行【文件】→【另存为】命令,在对话框中选择【保存类型】为Microsoft Word文档,单击【保存】。 ③ 借助格式转换工具软件 PDF向DOC格式转换的工具软件比较多,其中ScanSoft PDF Converter for Microsoft Word是由ScanSoft公司与微软共同开发的一个全新的Office 2003 插件。该插件可以通过Word直接将PDF文档转换为Word文档,并且完全保留原来的格式和版面设计。 ④ 图像形式PDF文件的转换 对于图像形式的PDF文件(从图像文件转换形成的PDF文件),可以将PDF文件打印到Microsoft Office 2003的Microsoft Office Document Image Writer打印机,生成一个MDI文件。用Microsoft Office Document Image打开此文件,执行【
您可能关注的文档
最近下载
- 丽声北极星分级绘本 五年级上册Unit4Emma's birthday.pptx VIP
- 2025中国铁路昆明局集团有限公司招聘普通高校毕业生(1746人)笔试备考题库及答案解析.docx
- 2024-2025学年人教版七年级上册英语期末专题训练:用单词的适当形式填空100题(含答案).docx VIP
- 芝麻坪隧道施工图设计说明.pdf
- 国家开放大学电大《MySQL数据库应用》形考任务三 实验3 数据增删改操作实验.docx
- 骨科疼痛的护理.pptx VIP
- 髂动脉溃疡的健康宣教.pptx
- 小学音乐人音版 五年级下册 小鸟小鸟 课件.ppt
- 物业公司安全生产操作规程.pdf VIP
- 学院年度工作总结PPT.pptx
文档评论(0)