第2章-信息编码和数据表示.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 用计算机处理汉字时,必须先将汉字代码化,即对汉字进行编码。西文是拼音文字,基本符号比较少,编码比较容易,而且在一个计算机系统中,输入、内部处理、存储和输出都可以使用同一代码。汉字种类繁多,编码比拼音文字困难,而且在一个汉字处理系统中,输入、内部处理、输出对汉字代码的要求不尽相同,所以用的代码也不尽相同。汉字信息处理系统在处理汉字和词语时,要进行一系列的汉字代码转换。 信息编码的概念 前面介绍的计算机中数值数据的各种编码 带符号数的编码方法:原码、反码和补码 整数和实数的编码方法:定点和浮点表示法 都具有值的含义,可以在计算机中进行运算 下面介绍西文字符编码和汉字字符编码 (西文)字符编码 常用西文字符:英文字母,数字字符、标点符号和控制字符等,共128个字符 ?在计算机中,要为每个字符指定一个确定的二进制代 码,作为识别与使用这些字符的依据 由于西文字符与二进制整数之间没有什么必然的联系,某一个字符究竟对应哪个整数完全可以人为地规定 由于编码是一个涉及世界范围内有关信息表示、交换、处理、存储的基本问题,因此都以国家标准或国际标准的形式颁布施行 字符编码有多种,应用最广泛的是ASCII码 ASCII American Standard Code For Information Interchange 美国标准信息交换码。这一编码最初是由美国制订的,后来由国际标准化组织(ISO)确定为国际标准字符编码 为了和国际标准兼容,我国根据它制定了相应的国家标准,即 GB1988 ASCII码的编码规则 用一个字节(8位二进制数)表示一个字符的编码 0 余下的7位可给出128个二进制编码 即0000 0000-0111 1111 可以表示128个字符 最高位取“0” ASCII码的编码规则 规定:每个字符用7位二进制数来表示,7位二进制共有128种状态(27= 128 ),可表示128个字符;即7位编码的取值范围为0000000~1111111 在计算机内,每个字符的ASCII码用1个字节( 8位)来存放,字节的最高位( d7)为校验位,通常用“0”来填充,后7位(d6d5d4d3d2d1d0)为编码值 7位编码的ASCII码字符集包括了128个字符,称为标准的ASCII码字符集 ASCII码表 编码 字符 第0到31 控制字符(32个) 第48到57 0~9的10个数字符号 第65到90 26个英语大写字母 第97到122 26个英语小写字母 其余 标点符号、运算符号等 第127 控制字符(1个) b7b6b5b4 b3b2b1b0 0000 0001 0010 0011 0100 0101 0110 0111 0000 NUL DLE SP 0 @ P ` p 0001 SOH DC1 ! 1 A Q a q 0010 STX DC2 “ 2 B R b r 0011 ETX DC3 # 3 C S c s 0100 EOT DC4 $ 4 D T d t 0101 ENQ ANK % 5 E U e u 0110 ACK SYN 6 F V f v 0111 BEL ETB ‘ 7 G W g w 1000 BS CAN ( 8 H X h x 1001 HT EM ) 9 I Y i y 1010 LF SUB * : J Z j z 1011 VT ESC + ; K [ k { 1100 FF FS , L \ l | 1101 CR GS - = M ] m } 1110 SO RS . N ^ n ~ 1111 SI US / ? O _ o DEL ASCII字符与编码对照表 例 已知字符“X”的ASCII码为 0101 1000 求字符“s” 的ASCII码 0101 1000 的10进制数为88(64+16+8) 88+32-5=115 转换为2进制数为 0111 0011 汉字编码 包括: 信息交换码(国标码) 区位码 内码 输入码和输出码 输入码 国标码 内码 字形码 汉字输入 汉字输出 各种代码之间的关系 汉字的二进制编码 用ASCII码不能完整表示汉字 常用汉字约有5000个 汉字和汉字字符是一个庞大集合 汉字及汉字字符的编码由国家定义,以GB强制性发布执行 汉字的二进制编码规则 用两个字节表示一个汉字字符,可定义255*255个汉字或汉字字符 考虑到与ASCII码的兼容和统一、留出控制字符等因素 每个字节的最高位取0 预留出0到32号和127号的控制字符(共34个) 确定字节的有效取值为 33—126(对应的十六进制数为21H—7EH) 可“独立”表示

文档评论(0)

jyr0221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档