第3章信息编码与数据表示-2-fjw.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章信息编码与数据表示-2-fjw

第三章 信息编码与数据表示 3.5 非数值数据的表示 非数值数据:文字和符号(字符)、图像、声音等 非数值数据的表示:对其进行二进制编码 一、字符编码 字符的表示:采用字符编码,即用规定的二进制数表示文字和符号的方法。 ASCII码:美国标准信息交换码,为国际标准,在全世界通用 。 常用的7位ASCII码的每个字符都由7个二进制位b6~b0 表示,有128个编码,最多可表示128种字符;其中包括: 10个数字‘0’~‘9’:30H~39H,顺序排列■ 26个小写字母‘a’~‘z’:61H~7AH ,顺序排列■ 26个大写字母‘A’~‘Z’:41H~5AH ,顺序排列■ 各种运算符号和标点符号等。 ASCII码编码表 ASCII码分类 95个可打印或显示的字符:称为图形字符,有确定的结构形状,可在打印机和显示器等输出设备上输出;而且这些字符均可在计算机键盘上找到相应的键,按键后就可以将相应字符的二进制编码送入计算机内。 33个控制字符:不可打印或显示,分成5类: ① 10个传输类控制字符:用于数据传输控制;■ ② 6个格式类控制字符,用于控制数据的位置 ■ ③ 4个设备类控制字符,用于控制辅助设备; ■ ④ 4个信息分隔类控制字符,用于分隔或限定数据■ ⑤ 9个其他控制字符、空格字符和删除字符。 基于IBM ProPrinter打印机的扩展ASCII码 二、汉字编码 对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出,它们分别对应着汉字输入码、交换码、内码、字形码的概念。 1、汉字输入码 汉字输入码也称外码,是为了将汉字输入计算机而编制的代码,是代表某一汉字的一串键盘符号。 汉字输入码种类: 数字编码:如区位码、国标码、电报码等。 拼音编码:如全拼码、双拼码、简拼码等。 字形编码:如王码五笔、郑码、大众码等。 音形编码:如表形码、钱码、智能ABC等。 二、汉字编码 2、汉字交换码:指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。 目前国内计算机系统所采用的标准信息处理交换码,是基于1980年制定的国家标准《信息交换用汉字编码字符集·基本集》(GB2312-80)修订的国标码。 该字符集共收录了6763个汉字和682个图形符号。6763个汉字按其使用频率和用途,又可分为一级常用汉字3755个,二级次常用汉字3008个。其中一级汉字按拼音字母顺序排列,二级汉字按偏旁部首排列。 采用两个字节对每个汉字进行编码,每个字节各取七位,这样可对128×128=16384个字符进行编码。 二、汉字编码 两种典型的数字编码作为交换码: 区位码:是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。例如“中”字位于54区48位,“中”字的区位码即为“5448”。 国标码:将区位码加2020H,占用两个字节。例如“中”字的国标码为区位码5448的区码和位码转化为16进制,为3630H,再加2020H得国标码5650H。 二、汉字编码 3、汉字内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。 汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的。 英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。 机内码等于汉字国标码加上8080H。例如“中”字的机内码为D6D0H。 文本文件中储存的是汉字内码。 二、汉字编码 4、汉字字形码 汉字字形码是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。 根据汉字输出的要求不同,点阵有以下几种: 简易型汉字:16×16, 32字节/汉字 普通型汉字:24×24, 72字节/汉字 提高型汉字:32×32,128字节/汉字。 汉字字库:将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库。 字模码:16×16点阵,需要16×16b=32B/汉字 汉字编码之间的关系 Unicode Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案,又称统一码、万国码、单一码,是一种在可在计算机上使用的字符编码。 它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。 Unicode 是基于通用字符集(Universal Character Set)的标准来发展,目前普遍采用的是UCS-2,它用两个字节来编码一个字符。 Unicode 16包含了GB18030里面的所有汉字(27484个字),其中中文字占用了x4E00~0x9FFF的编码部分。目前Unicod

文档评论(0)

sandaolingcrh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档