第2讲计算机信息的数字化表示.pptVIP

  • 3
  • 0
  • 约8.25千字
  • 约 49页
  • 2017-11-26 发布于湖北
  • 举报
第2讲计算机信息的数字化表示

计算机中的信息编码 BCD编码: 用一组4位二进制编码表示一个十进制数字符号,又称为8421码。 0000 0001 0010 0011 0100 0101 0110 0111 ‘0’ ‘1’ ‘2’ ‘3’ ‘4’ ‘5’ ‘6’ ‘7’ 1000 1001 ‘8’ ‘9’ 例如: ’74’的BCD码是: 3.汉字处理 (1)汉字库 (2)汉字信息处理 汉字处理方法包括汉字输入:通过汉字输入设备输入汉字外码,并通过其输入法程序把它转化为汉字机内码,存入存储器中;汉字信息加工处理:对汉字内码进行加工处理;汉字输出。 计算机中的信息编码 汉字编码 计算机中的处理汉字要解决哪些问题? 汉字很多 (一万多个) 汉字表示、存储、交换? 汉字输入 汉字显示 计算机中的信息编码 汉字编码 汉字编码之间的关系 汉字输入码 汉字交换码 汉字机内码 输入法 字库 存储 通信 交换码 显示、打印 汉字字型码 汉字编码 汉字交换码 汉字交换码是指具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。 1981年,发布汉字交换码第一个国家标准: 《信息交换用汉字编码字符集·基本集》(代号GB2312-80),一般简称为国标码或GB码。 字符集=6763个汉字+682个图形符号。 6763个汉字=一级常用汉字3755个+二级次常用汉字3008个。其中一级汉字按拼音字母顺序排列,二级汉字按偏旁部首排列。 汉字编码 国标码 目标:使字符集中每个汉字或中文全角符号能在国内有一个统一的唯一代码与其对应。 作电子表格: 128行、128列 编码:记录所在的行和所在的列,编码采用二个字节,第一个字节表示行,第二个字节表示列。一般用4位的16进制数表示 编码表示: “啊”-字符集中第48行、第33列,表示为3021H 汉字编码 汉字机内码 汉字机内码——汉字输入到计算机中,用计算机中统一规定的代码表示。机内码用于汉字信息的存储、交换、检索等操作。 能直接用国标码作为机内码吗? 计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码——用一个字节表示,最高位置为0。 “保”-31 23H “1” – 31H “#”- 23H 假如内存中出现两个字节31H和23H:这到底是一个汉字,还是两个西文字符“1”和“#”? 0 出现了二义性 汉字编码 汉字机内码 国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,因此国标码不能在计算机内部直接使用。 汉字的机内码需在国标码的基础上进行变换,其变换方法为:将国标码的两个字节的最高位由0改1,其余7位不变 如:保”字的国标码为3123H,前字节(高位改1)?;后字节 ? 即为B1A3H,因此,字的机内码就是B1A3H; 相当于每个字节都加上128(即80H) 3123H + 8080H = B1A3H 汉字编码 机内码 总结: 英文字符的机内代码即是七位的ASCII码,用一个字节表示,最高位置为0。 汉字机内码:为了与西文字符编码相区别,汉字机内采用两个字节编码,基于国标码变换,将国标码的两个字节最高位改为1。 0 1 1 0 0 国标码 汉字机内码 ASCII码 3.汉字交换码(其它编码标准) UCS编码:通用多八位编码字符集(组、面、行、位四个字节组成) Unicode编码:将全世界最常用的文字符号放在UCS中的0组、0面。只需2个字节编码。 GBK码:扩展汉字内码规范。基于UCS、兼容GB2312标准。 BIG5编码:港台使用的繁体汉字的编码标准 与大陆使用的国标码不同,上网时需切换 汉字编码 汉字输入码 汉字的字数繁多,字形复杂,常用的汉字符号有7千个,比英文的26个字母要多得多。 西文符号可以用标准键盘直接输入。 汉字输入到计算机内是一个问题。为了能使用西文标准键盘进行汉字输入,必须为汉字设计相应的编码方法,编制软件实现输入。 汉字输入码分类: 数字编码 拼音码 字形编码 输入码 输入法程序 编码表 机内码 交换码 汉字输入码 ?⑴数字编码? 数字编码就是用数字串代表一个汉字的输入,常用的是国标区位码。 国标区位码将国家标准局公布的的6763个两级汉字分成94个区,每个区定为94位,实际上也是把汉字集合组织成二维表的形式 区码和位码各用两位十进制数字表示,因此,输入一个汉字需要按键四次。例如,“中”字位于第54区48位,区位码为5448 区位码表的排列是有规律的。在94个分区中,1—15

文档评论(0)

1亿VIP精品文档

相关文档