汉字信息的处理基础知识.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 文字处理与编辑排版 本章的教学目标 1.理解与熟练掌握: 汉字信息处理的基本问题。 Wod2003的启动和退出 Word2003的编辑环境 Word2003的基本编辑方法 Word2003的编辑技巧和文本的排版 2、一般理解与掌握: 数学公式的编辑。 模板、样式和图文混排 文本的打印输出。高级编辑技巧 4.1文字信息的计算机处理过程 1、字符编码 以英文信息的计算机处理为例,英文字符的编码标准 是ASC|码,这是七位的二进制代码。ASC的全称是 American Standard Code for Information Interchange 即美国信息交换标准代码。 、文字处理的过程 (1)文字信息的输入 对于英文字符来说,通常通过键盘把组成英文词汇的 各个英文字母逐个地输入。这一过程键盘的作用是把输入 的每个字、数字或符号转换成它们所对应的代码,供下 步信息处理用。 41文字信息的计算机处理过程 (2)文字信息处理 文字信息包括多种不同的处理要求。例如,在文稿 的编辑操作中,有对文字的增、删、改操作;有对若干 个字、整个句子整段文字的增、删、改操作。这些操作 都是可以通过预先编制好的处理程序,如Word或WPS 等软件来实现 (3)文字信息的输出 文字信息处理完毕后,要把处理结果的代码信息转 换成文字形式输出,输出的方式包括显示和打印。为此, 在计算机系统中要存储有关文字的字形信息。 41文字信息的计算机处理过程 计算机中存储的文字字形,是以点阵的形式表示的 通常,英文字符信息用5×7或7×9的点阵表示,如下图4 所示。计算机输出处理结果时,根据每个字符的代码计算 字形信息在存储器的存储地址,按照这一地址读出字符的 点阵信息,供显示器或打印机输出。 4.2中文文字信息的处理 1、汉字特点 汉字的主要特点是它属于象形文字,字量大,字形 复杂,和西文国家广泛使用的拼音文字有显著的区别 汉字输入技术 1)汉字输入方法 汉字输入计算机的主要方法仍是键盘,通过汉字编 码方法输入 (2)汉字编码 汉字编码输入方法有两大类,一类是整字编码法 另一类是按汉字 或发音特征,或利用汉字的形 音特征相结合的编码方法, 4.2中文文字信息的处理 (1)键盘输入 汉字的字符数目远远多于英文键盘按键的数目 因此要用几个键的组合来表示一个汉字。这种键的组 合称为“汉字输入编码”。 输入码冷汉字输入法软件 机内码 常见的输入码有“形码”,如郑码、五笔字型码等 音码”,如“智能ABC”、“清华紫光”等 (2)其他输入设备 ◆光学字符阅读器(OCR-0 ptical character Reader)可以将印刷体汉字作为图形点阵输入, 然后进行字符识别,把汉字点阵转换成对应的机 内码。这种方法已经达到实用阶段,但是设备较 昂贵。 ◆手写板输入基于计算机模式识别技术,专用 的软件能够识别手写输入的文字、符号,将其转 换为机内码。这种输入设备已经商品化。 3、汉字字模库 无点位:用“0”表 有点位:用“1”表 字模:描述一个汉字点阵信息的 若干个二进制代码串 3、汉字字模库 1)汉字输出主要是指汉字字形的输出。输出方式有两 种:显示和打印。 (2)不论哪一种输出方式,都是把一个汉字看成一个 维图形,并把笔划离散化,用一个点阵来表示一个汉字 (3)描述一个汉字点阵信息的二进制代码串称为汉字的 字模”。所有汉字和各种符号的点阵信息就组成汉字 的“字模库”(简称字库)。显然,要实现近8000 常用汉字和符号的显示和打印,字库要占很庞大的存储 空间。例如16×16点阵的汉字库(包括一级和二级汉字) 就需要约240KB的存储空间。24×24点阵的汉字库需 580KB,精密字库所需的存储空间更大。

文档评论(0)

kefuxing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档