第三章汉字编码原理.pptVIP

  • 20
  • 0
  • 约7.99千字
  • 约 95页
  • 2019-08-30 发布于湖北
  • 举报
第三章汉字编码原理 第三节 汉字编码原理 一、什么是汉字编码 汉字外码:汉字的字母数字代码 计算机人机界面:键盘 字母 数字 控制符号 功能键位 二、汉字编码的历史发展 广义的汉字编码是从汉字字书的编撰算起的。因为字典的编撰,离不开字的排序和检索。 字典是供人来*查阅,编码输入法是让机器到字库中去查找。都是按照某种规则排列和检索汉字*的。 可以说,早期的汉字排字检字法就是汉字编码的早期形式。比如, 笔画部首法、四角号码法、拼音查字法、笔形查字法等。 最早的汉字代码 1880年清政府创办电报局,由丹麦人设计的汉字电报码。它的方法是将电报用的汉字按照笔画顺序由少到多排列成一个字表。 使用的字数不到一万,就以字的顺序号作该字的代码。第一个字的代码就是0001,第五个字的代码就是0005,第385个字的代码就是0385。 电报码一直使用到今天,经过不断的修订完善成为《标准电码本》。 十个数字如果转换为二进制表示,则只需四位二进制单位。这样,用“嘀——嗒”两种状态就可以传输汉字了。 电报码的特点是“字”-“码”一一对应,没有重码。 缺点是难以记忆,非经过专门训练无法使用。 三、编码原理 1、确定编码对象 汉字的总字数有6万多,现代汉语常用的也有1万左右。《信息交换用汉字编码字符集基本集》根据各种统计数据确定收入汉字6763个。这些汉字就是一个编码对象的数量级。 “大字符集” 包括大陆、台湾、

文档评论(0)

1亿VIP精品文档

相关文档