2014第2章信息编码与数据表示重点.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ASCII码的编码规则 在计算机内,每个字符的ASCII码用1个字节( 8位)来存放,字节的最高位( d7)补0”来填充,后7位(d6d5d4d3d2d1d0)为编码值 → 27=128 7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集 ASCII码表 编码 字符 第0到31 控制字符(32个) 第48到57 0~9的10个数字符号 第65到90 26个英语大写字母 第97到122 26个英语小写字母 其余 标点符号、运算符号等 第127 控制字符(1个) 高四位 低四位 A为(0100 0001)2=65 例 已知字符“X”的ASCII码为 0101 1000 求字符“s” 的ASCII码 0101 1000 的10进制数为88(64+16+8) 88+32-5=115 转换为2进制数为 0111 0011 主要内容 常用数制及其相互转换 二进制数的运算 数值数据在计算机中的表示 西文字符编码 中文信息编码(了解) 汉字编码 包括: 信息交换码(国标码) 区位码 内码 输入码和输出码 输入码 国标码 内码 字形码 汉字输入 汉字输出 各种代码之间的关系 汉字的二进制编码 常用汉字约有5000个,用ASCII码不能完整表示汉字 汉字及汉字字符的编码由国家定义,以GB强制性发布执行 汉字的二进制编码规则 用两个字节表示一个汉字字符,可定义255*255个汉字或汉字字符 考虑到与ASCII码的兼容和统一、留出控制字符等因素 每个字节的最高位取0 预留出0到32号和127号的控制字符(共34个) 确定字节的有效取值为 33—126(对应的十六进制数为21H—7EH) 可“独立”表示 94*94=8836 个汉字字符 0 0 216=65536, 214=16384 图示 94 行 94列 国标GB-2312-80 称为信息交换码;又称为国标码 共收录7445个汉字及图形符号: 一般符号: 202个; 序列号: 60个 数字: 22个;英文字母52个、日文假名169个 希腊字母48个、俄文字母66个 汉字6763个:一级汉字字符3755(以汉语拼音索引) 二级汉字字符3008(以偏旁部首索引) 高八位 低八位 与ASCII码兼容的控制字符区 信息交换码/国标码 区位码 汉字国标码实际上是一个94?94的二维字符集,编码规则是用两个字节即16个二进制位进行编码的,其中一个字节表示行号,一个字节表示列号,将行号和列号组合起来就构成了汉字国标码 区位码:用两位十进制数对行号进行编码,用另两位十进制数对列号进行编码,将行号和列号组合起来就构成了用4位十进制数编码的汉字区位码。 区号就是行号,位号就是列号 如:汉字“啊”在编码表中第16行、第1 列,区位码就是1601。区号和位号的范围都是从1~94。 区位码可以作为一种输入码 汉字内码 为汉字及汉字字符编码的目的之一是可以在计算机中实现存储 存储中产生混乱: “鞍”的信息交换码为 对应的16进制数为 3030H 字符‘0’的ASCII码为 30H ----易造成‘鞍’与‘00’的混乱! 汉字字符在计算机内部存储的二进制形式代码成为“机内码”,也称“内码” 将信息交换码两个字节的最高位取“1” 汉字各编码方式间的关系 内码与信息交换码的关系为: 信息交换码=内码-8080H 内码=信息交换码+8080H 将信息交换码的两字节分别减去‘20H’或’32’,得到区位码 信息交换码和内码用16进制数表示、区位码用10进制数表示 汉字编码的例 啊: 信息交换码;0011 0000 0010 0001;3021H 区位码:1601 (30H-20H=48-32=16) (21H-20H=33-32=01) 内码: 1011 0000 1010 0001;B0A1H (3021H+8080H=B0A1H) 汉字输入码 汉字由于数量大,字形复杂,字音多变 ,无法直接使用西文标准键盘进行输入 必须为汉字设计基于西文键盘的输入编码方法 当用户从键盘上输入汉字的输入码后,再由相应的输入法应用程序完成从输入码到内

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档