- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二进制信息编码创作王达参考教材深入理解计算机网络
二进制信息编码 创作:王达 参考教材:《深入理解计算机网络》 一、什么叫信息编码? 上堂课介绍了二进制数的表示形式:原码、反码、补码,本节介绍另一种意义上的二进制数,那就是编码,但它们并没有“数”的意义,不参与运算? “数”不仅仅用来表示“量”,它还能作为“代码(Code)”来使用。例如,在我国实行的公民身份证制度,身份证上有一组18位的数为“身份证号码”。这就是用数字进行编码的例子。再如每一个学生入学后都会有一个学号,这也是一种编码? 编码的目的之一是为了便于标记特定的对象。为了便于记忆和查找,在设计编码时需要按照一定的规则。这里介绍最常用的几种计算机编码,如ASCII码和汉字编码(又根据不同应用场景分为不同的编码) 二、西文编码 ASCII码 分为“标准ASCII码”和“扩展ASCII码” 标准ASCII码:采用7位二进制进行编码(共8位,但仅由低7位,最高位为奇偶校验位),可组合表示128(27)种状态,对应128个(对应十进制取值为0~127)字符(或控制符) 【说明】所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位位置1(否则为0);偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位置1(否则为0) 扩展ASCII码 扩展ASCII码采用8位二进制进行编码,是对标准ASCII编码的扩展,第8位也用于信息编码,新增的第8位为1的信息编码用于确定附加的 128 个(对应十进制取值为128~255)表格符号、计算符号、希腊字母和特殊的拉丁符号 2. Unicode编码 Unicode编码最初是Apple公司发起制定的通用多文种字符集,后来被 Unicode 协会开发为能表示几乎世界上所有书写语言的字符编码标准 Unicode编码包括 UTF-8,UTF-16 和 UTF-32这几种编码格式,分别指使用8位、16位或32位表示字符。 三、汉字编码 计算机中汉字的表示也是用二进制编码。根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码 外码 外码也叫输入码,用来解决汉字输入的编码问题,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等 交换码(国标码) 中国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码,是在大陆及海外使用简体中文的地区(如新加坡等)是强制使用的唯 一中文编码。 在GB2312—80标准中共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时收录了包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个字符 交换码仅是一个中文汉字、字符集标准,每个汉字的编码方式则由下面将要介绍的“区位码”解决 区位码 区位码是国标码的具体编码实现方式。它把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵,即94个区,每个区中又有94个位,对应94个汉字或字符,总区位数为8836个,即总共可编码8836个汉字或字符。区位码用来解决计算机识别汉字的能力,也可作为输入码(如区位码输入法),但它并不是计算机内部处理汉字的编码方式,在计算机内部汉字编码是由机内码进行的 (1)01-09区为特殊符号;(2)16-55区为一级汉字,按拼音排序;(3)56-87区为二级汉字,按部首/笔画排序;(4)10-15区及88-94区目前暂未使用,留待以后扩展汉字或字符使用 机内码 机内码是根据国标码的规定,确定在计算机内部表示一个汉字的二进制代码。在计算机内部和磁盘中汉字代码都用机内码表示的 字形码 字形码是汉字的输出码,解决汉字输出的编码方式。输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字 *
文档评论(0)