(2.1.13)--微课1-13汉字编码大学计算机基础.pptVIP

  • 0
  • 0
  • 约小于1千字
  • 约 9页
  • 2023-12-06 发布于陕西
  • 举报

(2.1.13)--微课1-13汉字编码大学计算机基础.ppt

1.13汉字编码

汉字编码在计算机中汉字如何表示?如何将汉字输入计算机?如何将计算机内存储的汉字信息输出显示?

汉字编码对汉字编码常用的字符集是GB2312-80,其全称为《信息交换用汉字编码字符集·基本集》。GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共7445个图形字符。其中包括6763个汉字,这些汉字按照使用频率高低分为两级:一级汉字3755个,按汉语拼音排列;二级汉字3008个,按偏旁部首排列。

区位码GB2312将所有字符排放在一个94行、94列的二维表格中,并用01至94分别对行和列依次进行编号,如第一行的行号为01,第94行的行号为94,第1列、第94列的列号为94等。其中的行号又称为区号,列号又称为位号,将区号和位号前后排在一块就构成了区位码。例如,“啊”字位于二维表格的第16行第01列,则区位码是1601。

国标码区号和位号各加上32就构成了国标码,一个国标码占两个字节宽度,每个字节的最高位均为“0”。例如,“啊”字的区位码为1601,将区号16+32=48,位号01+32=33,所以“啊”字的国标码为4833.

机内码将国标码每个字节的最高位由“0”变成“1”,就得到了汉字机内码。可见,一个机内码也占两个字节,但每个字节的最高位均为“1”,这主要是为了在计算机内部能够区分是汉字编码还是ASCII码。由于B=128,将国标码两个字节的最高位设置为“1”相当于将国标码两个字节的数据分别加上128。例如:“啊”字的国标码为4833,将第一个字节数据48+128=176,33+128=161,将176和161转换为16进制数据,则求得“啊”字的机内码为(B0A1)H

汉字编码为了能直接从键盘上输入汉字,就需要为汉字进行相应的编码。目前常用的汉字输入编码方法可分为数字编码、拼音编码和字形编码。

汉字编码汉字字形码通常有两种表示方式:点阵表示方式和矢量表示方式。

汉字编码方法

文档评论(0)

1亿VIP精品文档

相关文档