计算机组成原理第二章第4讲字符和字符串(非数值)的.pptVIP

  • 14
  • 0
  • 约3.86千字
  • 约 27页
  • 2017-05-29 发布于北京
  • 举报

计算机组成原理第二章第4讲字符和字符串(非数值)的.ppt

字符和字符串(非数值)的表示方法 2.1.3字符和字符串(非数值)的表示方法 符号数据:字符信息用数据表示,如ASCII等; 字符表示方法ASCII:用一个字节来表示,低7位用来编码(128),最高位为校验位 10个十进制数码 26个英文字母 一定量专用符号:控制码 2.1.3字符和字符串(非数值)的表示方法 ASCII (American Standard Code for Information Interchange) 共128个常用字符,用7位二进制编码,从0到127 控制字符:0~32、127计34个; 普通字符:94个。 2.1.3字符和字符串(非数值)的表示方法 例如: “a”字符编码为1100001,对应的十进制数是97; 换行 0AH 10 回车 0DH 13 空格 20H 32 ‘0’~‘9’ 30H~39H 48~57 ‘A’~‘Z’ 41H~5AH 65~90 ‘a’~‘z’ 61H~7AH 97~122 2.1.3字符和字符串(非数值)的表示方法 2.1.3字符和字符串(非数值)的表示方法 2、字符串的表示 字符串是指连续的一串字符,通常方式下,它们占用主存中连续的多个字节,每个字节存一个字符。 当主存字由2个或4个字节组成时,在同一个主存字中,既可按从低位字节向高位字节的顺序存放字符串的内容,也可按从高位字节向低位字节的次序顺序存放字符串的内容。 2.1.3字符和字符串(非数值)的表示方法 eg. IF AB THEN READ(C) 汉字编码体系 汉字编码: 汉字是平面结构,字数多,字形复杂,汉字字符集是一个很大的集合,在人们日常生活交往中,经常使用的汉字约有6000多个,使用7位二进制编码是不够的,因此规定用16位二进制代码表示汉字。 每个Byte仅用低7位,因此两个字节可表示128x128=16384个汉字。为了与标准ASCII码兼容,每个字节中都不能再用0-32、127共计34个编码,所以每个字节只能有128-34=94个编码。这样,双七位实际能够表示的字数是:94×94=8836个。 汉字编码体系 汉字输入码:由输入设备产生的汉字编码,如区位码、国标码、拼音码、新全拼、新双拼、五笔字型码、简码、表形码、自然码、智能ABC汉字输入码等。 如“保”字,用全拼,输入码为“BAO”, 用区位码,输入码为“1703 ”, 用五笔字型则为“WKS” 国标码:国家汉字标准代码,简称国标码,是中华人民共和国的中文常用汉字编码集,GB 2312。 汉字编码体系 汉字内码:也叫机内码,用于计算机内部存储和处理的汉字编码,通常由该汉字的国标码的两个字节最高位置“1”形成。 汉字字形码:也叫字模码,确定一个汉字字形点阵的编码,用于汉字显示和打印输出。保留在存储介质中的全部汉字字形码称为字库。 汉字地址码:表示汉字字形信息在汉字库中的地址,用于在汉字库中查找汉字字形信息的汉字地址码等。 汉字编码体系 区位码: 将字符按其排列位置划分成94区×94位,以字符所在区位编码。 例如: 区位码4687表示 区号为46,在该区中的位置为87。 区号 区中位置 汉字编码体系 区位码的编码范围是:0101~9494 (0101H~5E5EH) 1…………………………..94 1~9区 10~15区空 16~55区 56~87区 88~94区空 字母、数字、各种符号等 682个 一级汉字 3755个 二级汉字 3008个 汉字编码体系 区位码可变形为国标码: 国标码=区位码+2020H 国标码的取值范围: 2121H~7E7EH 国标码、区位码均用两个字节组成一个汉字编码。 汉字编码体系 机内码

文档评论(0)

1亿VIP精品文档

相关文档