第二节、计算机数据表示方法.ppt

第二章、计算机数据表示方法 原著 谭志虎 Outline 2.1 非数值数据表示法 2.2 数值数据表示法 2.3 数据信息的校验 Data Representation Qualitative Quantitative Integers Signed Unsigned Non-integers (Real) Signed Unsigned 2.1 非数值数据表示法 字符表示法 characters 汉字表示法 Chinese characters 2.1.1 Character representation … 如何使用数值表示字符数据 Standards ASCII-American Standard Code for Information Interchange (ANSI 7bits) EBCDIC-Extended Binary-Coded Decimal Interchange Code (IBM 8bits) Unicode 128 Standard ASCII codes 52 Letters a-z, A-Z 10 Digits 0-9 34 Symbols ! @ # $ % ^ * ( ) … 32 Control characters CR BEL ESC LF … ASCII 使用7bit表示128个字符 From 000 0000 to 111 1111 27=128 注意:ASCII中的数字字符和数字本身不相等 几乎所有计算机均支持该代码集 但不是所有语言都能用128个字符表示 8Bit??? MSF=0 Terminology 计算机利用寄存器存储数据 寄存器中每个位称bit (Binary DigiT) 最高有效位 (MSB) 最低有效位 (LSB) 2.1.2 汉字表示法 8 bit数据仅能表示256个字符,常用汉字6000多个,故其无法表示汉字 GB2312国家标准采用16位表示 与ASCII字符的区别,最高有效位MSB=1 内码,外码(输入法),字模码(显示用) GB2312-80国家标准 1981年,GB2312-80国家标准,包括6763个汉字/682个非汉字字符,称为国标码或国际交换码 GB2312字符集的构成: 一级常用汉字3755个,按汉语拼音排列 二级常用汉字3008个,按偏旁部首排列 非汉字字符682个 汉字标准 GB2312-1980(GB0)(简体) 6763个汉字 GB13000-1993 20902个汉字 (Unicode 1.1版本) 汉字扩展规范GBK1.0 标准1995(非国家标准) 21003个字符(兼容GB2312) GB18030-2000(1/2/4字节编码) 27484汉字 (向下兼容GB2312 GBK,GB13000) 字模码介绍 字模码是用点阵表示的汉字字型代码,是汉字的输出形式。 字模点阵的信息量是很大的,所占存储空间也很大。以16*16为例,每个汉字要占用32个字节, 因此字模点阵只能用来构成汉字库,而不能用于机内存储。 Charset META content=text/html; charset=gb2312 … http-equiv=Content-Type charset=gb2312 简体中文 charset=big5 繁体中文 charset=EUC_KR 韩语 charset=Shift_JIS 或 EUC_JP 日语 charset=KOI8-R/Windows-1251俄语 charset=iso-8859-2 中欧语系 charset=utf-8 unicode多语言 Unicode 用于克服字符数字的限制 为所有语言中的字符分配唯一的代码 16 bit 字符集,65536 Unicode 字符 提供唯一的代码 不论任何平台 不论任何程序 不论任何语言 Universal Character Set ISO UCS ISO 10646 UCS-2 UCS-4 UTF (Unicode Transform format) UTF-7 UTF-8 UTF-16 Terminology UUEncode/Uudecode MIME (Multipurpose Internet Mail Extensions ) 2.2 数值数据表示方法 计算机数值数据表示的特点 进位制数 数的定点、浮点表示 机器数 计算机数据编码需要考虑的因素: 数的类型(小数、整数、实数和复数) 数值范围 数值精确度 数值存储和处理所需的硬件代价 计算机数据编码特点 少量简单的基本符号表示大量复杂的信息

文档评论(0)

1亿VIP精品文档

相关文档