文本信息加工.pptVIP

  • 14
  • 0
  • 约2.11千字
  • 约 19页
  • 2017-02-24 发布于北京
  • 举报
文本信息加工.ppt

* * 文 本 信 息 加 工 一、文字及其处理技术 1、体验文字处理技术 字母文字 以字母拼写方法的不同表达不同的含义 象形文字 使用自身的“形”直接昭示其含义 汉字起源于象形文字,至今仍然保留了象形文字的特点。 汉字的造字法有四种:象形、指事、会意、形声。 这是一个指事字。从字体上看,就是本 字倒过来。上部为树头,下部为树梢, 在树梢上加一小横,就表示这里是树梢。 因此,末的最初的意义是树梢。 象形 指事 一、文字及其处理技术 金文「明」为日月幷照之会意字。 会意 东巴文字——现代活着的象形文字 一、文字及其处理技术 历史上使用的文字处理技术 手写 刻字 雕版印刷 活字印刷 机械式 打字机 计算机 文字处理 计算机文字处理 只能处理英文 可处理包括象形文 字在内的任何文字 如何在计算机中处理汉字? Ⅰ输入码(外码): 用于输入汉字,如区位码、拼音码、王码(五笔字型)、自然码等。 Ⅱ机内码(内码): 用于储存汉字,如国标码(GB)、BIG5码等。 2、汉字的编码 一、文字及其处理技术 ①国标码字符集GB2312-80:该字符集收录了6763个常用汉字,其中一级汉字3755个,二级汉字3008个。另外还收录了各种符号682个,合计7445个。 ②台湾BIG5码收录了13000多个汉字,是目前见到的收录汉字最多的汉字系统。 ③GBK汉字集:GBK即汉字扩充内码规范,又称大字符集,一共收录了20900个汉字。 ● ● ● ● ● ● ● ● ● ● ● ● →→→→→→→→● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 储存这个字型码需要8×8=64位二进制, 即8个字节(1字节=8位二进制) Ⅲ输出码(字型码): 字模(点阵、向量) 一、文字及其处理技术 一、文字及其处理技术 2、汉字的编码 目前计算机上使用的汉字编码主要有三种。 输入码 (外码) 机内码 (内码) 输出码 (字型码) 用于输入汉字的编码 用于存储汉字的编码 用于输出汉字的编码 区位码 :4860 全拼编码:xiong 五笔字型:CEXO 熊 用机内码 表示、存储 如国标码(GB)和 BIG5码 用汉字字型 输出汉字 一、文字及其处理技术 例:“春”字在计算机中的处理过程。 二、字处理软件 文字处理:就是进行文字类稿件的输入、编辑、排版和发布。 字处理软件是最普及的办公软件, 如WPS、Word、永中Oiifce等。 应用字处理软件加工文本信息必须以明确需求为前提。 二、字处理软件 1、常用的字处理软件 Windows操作系统附带的简单文字处理软件 记事本 写字板 Word Microsoft Office套装软件之一,功能强大,国际通用性强 WPS 我国金山公司开发的,更符合中文用户的使用习惯, 具有民族特色 Dreamweaver Frontpage 网页制作工具,适用于制作在网络上流通的网页文件 Powerpoint 文稿演示工具,适用于制作方便演讲者表达信息的现场 演示文稿。 …… 二、字处理软件 2、字处理软件的基本特征 1、GUI(图形用户界面)界面:简单易学 2、功能丰富:个性选择 3、变化迅速:易于迁移 二、字处理软件 3、实践 我们在使用word或wps等软件进行文本处理时,可以发现字处理软件通 常具有一些基本特征。下列选项中,哪个是错误的? A、图形用户界面,简单易学 B、功能比较丰富 C、更新缓慢,难以迁移 D、个性功能选择 三、文本信息的结构化和形象化 1、文本信息的结构化表达 在某个音乐网站上,将音乐分为“中国音乐”和“外国音乐”,在“中国 音乐”里面分了“港澳台音乐”和“大陆音乐”两种,在“外国音乐”里分 了“欧美音乐”和“日韩音乐”;“大陆音乐”里面又分了“男歌手”、“女 歌手”和“组合乐队”,在“女歌手”里面有“宋祖英”、“彭丽媛”等歌手 的作品。 1 、文字表达 2、项目式表达 三、文本信息的结构化和形象化 3 、表格表达 4、结构图表达 中国音乐 外国音乐 港澳台音乐 大陆音乐 欧美音乐 日韩音乐 男歌手 女歌手 组合乐队 宋祖英、彭丽媛 三、文本信息的结构化和形象化 5 、流程图表达 画出寄信的过程,注意:如果对方不存在,这信要返回寄信人手中。 三、文本信息的结构化和形象化 2、文本信息的形象化表达 1 、文字表达 北京时间 2000 年 10 月 21 日凌晨,第 12 届亚洲杯小组赛全部结束, 八强全部产生

文档评论(0)

1亿VIP精品文档

相关文档