汉字的编码精要.pptVIP

  • 7
  • 0
  • 约2千字
  • 约 14页
  • 2016-11-12 发布于湖北
  • 举报
“ ” “ ” 汉字的编码 汉字也是一种字符,也需用“0”、“1”组合进行编码,才能被计算机接受。汉字是象形文字,有近60000个左右的汉字,常用汉字就有7000个左右。汉字的编码处理与西文的拼音文字有较大区别,汉字信息处理较复杂,它涉及输入码、内码、字型码等多种编码。 1.汉字输入码 为了能直接在键盘上输入汉字,就需要为汉字进行相应的输入编码。采用输入码,就是通过键盘的字母、数字等实现汉字的输入。 常见的输入编码方法有数字、字音编码、字型、混合编码。 数字编码常用的是国标区位码,电报码等,用4位十进制数字串代表一个汉字。国标区位码是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,一位就是一个汉字。实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码,区码和位码各两位十进制数字,因此输入一个汉字需键四次,例如“中”字位于第54区48位,区位码为5448。 该编码无重码,但难记忆。 例:“学”字的区号为49,位号为07,其区位码为4907,用2个字节的二进制数表示为: 00000111 ISO2022规定每个汉字的区号和位号必须分别加上32(即二进制,经过这样的处理而得的代码就是国标码。 “学”字的国标码计算为: ? 0

文档评论(0)

1亿VIP精品文档

相关文档