(计算机组成原理)第3章 信息编码与数据表示-2-fjw.ppt

(计算机组成原理)第3章 信息编码与数据表示-2-fjw.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(计算机组成原理)第3章 信息编码与数据表示-2-fjw

第三章 信息编码与数据表示 3.5 非数值数据的表示 非数值数据:文字和符号(字符)、图像、声音等 非数值数据的表示:对其进行二进制编码 一、字符编码 字符的表示:采用字符编码,即用规定的二进制数表示文字和符号的方法。 ASCII码:美国标准信息交换码,为国际标准,在全世界通用 。 常用的7位ASCII码的每个字符都由7个二进制位b6~b0 表示,有128个编码,最多可表示128种字符;其中包括: 10个数字‘0’~‘9’:30H~39H,顺序排列■ 26个小写字母‘a’~‘z’:61H~7AH ,顺序排列■ 26个大写字母‘A’~‘Z’:41H~5AH ,顺序排列■ 各种运算符号和标点符号等。 ASCII码编码表 ASCII码分类 95个可打印或显示的字符:称为图形字符,有确定的结构形状,可在打印机和显示器等输出设备上输出;而且这些字符均可在计算机键盘上找到相应的键,按键后就可以将相应字符的二进制编码送入计算机内。 33个控制字符:不可打印或显示,分成5类: ① 10个传输类控制字符:用于数据传输控制;■ ② 6个格式类控制字符,用于控制数据的位置 ■ ③ 4个设备类控制字符,用于控制辅助设备; ■ ④ 4个信息分隔类控制字符,用于分隔或限定数据■ ⑤ 9个其他控制字符、空格字符和删除字符。 基于IBM ProPrinter打印机的扩展ASCII码 二、汉字编码 对于汉字,计算机的处理技术必须解决三个问题:汉字输入、汉字储存与交换、汉字输出,它们分别对应着汉字输入码、交换码、内码、字形码的概念。 1、汉字输入码 汉字输入码也称外码,是为了将汉字输入计算机而编制的代码,是代表某一汉字的一串键盘符号。 汉字输入码种类: 数字编码:如区位码、国标码、电报码等。 拼音编码:如全拼码、双拼码、简拼码等。 字形编码:如王码五笔、郑码、大众码等。 音形编码:如表形码、钱码、智能ABC等。 二、汉字编码 2、汉字交换码:指不同的具有汉字处理功能的计算机系统之间在交换汉字信息时所使用的代码标准。 目前国内计算机系统所采用的标准信息处理交换码,是基于1980年制定的国家标准《信息交换用汉字编码字符集·基本集》(GB2312-80)修订的国标码。 该字符集共收录了6763个汉字和682个图形符号。6763个汉字按其使用频率和用途,又可分为一级常用汉字3755个,二级次常用汉字3008个。其中一级汉字按拼音字母顺序排列,二级汉字按偏旁部首排列。 采用两个字节对每个汉字进行编码,每个字节各取七位,这样可对128×128=16384个字符进行编码。 二、汉字编码 两种典型的数字编码作为交换码: 区位码:是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。例如“中”字位于54区48位,“中”字的区位码即为“5448”。 国标码:将区位码加2020H,占用两个字节。例如“中”字的国标码为区位码5448的区码和位码转化为16进制,为3630H,再加2020H得国标码5650H。 二、汉字编码 3、汉字内码 汉字内码是用于汉字信息的存储、交换、检索等操作的机内代码,一般采用两个字节表示。 汉字可以通过不同的输入法输入,但其内码在计算机中是唯一的。 英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能相互区别,汉字机内代码中两个字节的最高位均规定为“1”。 机内码等于汉字国标码加上8080H。例如“中”字的机内码为D6D0H。 二、汉字编码 4、汉字字形码 汉字字形码是将汉字字形经过点阵数字化后形成的一串二进制数,用于汉字的显示和打印。 根据汉字输出的要求不同,点阵有以下几种: 简易型汉字:16×16, 32字节/汉字 普通型汉字:24×24, 72字节/汉字 提高型汉字:32×32,128字节/汉字。 汉字字库:将所有汉字的字模点阵代码按内码顺序集中起来,构成了汉字库。 汉字编码之间的关系 3.6 校验码 一、校验码概述 1、校验码定义:是一种具有发现某些错误或自动改正错误能力的一种数据编码方法。 2、校验码目的:用于检查或纠正在存取、读写和传送数据的过程中可能出现的错误。 3、校验码的基本思想:“冗余校验”,即通过在有效信息代码的基础上,添加一些冗余位来构成整个校验码。 4、校验码的构成:有效信息+校验位(由有效信息产生的冗余位) 一、校验码概述 5、校验过程: 一、校验码概述 6、校验码原理:通过判断代码的合法性来检错的。 只有当合法码之间的码距d=2时,校验码才具有检错能力,当码距d= 3时,校验码才具有纠错能力。 码距:一种码制的码距是指该码制中所有代码之间的最小距离。 两个代码之间的距离:在一种编码中,在任何两个

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档