计算机组成原理6..pptxVIP

  • 2
  • 0
  • 约5.67千字
  • 约 53页
  • 2019-01-14 发布于湖北
  • 举报
计算机组成原理 Computer?Organization;第二章 数制与编码 第四节 计算机中的信息表示;十进制数的二进制编码 二―十进制编码:用若干位二进制代码来表示一位十进制数字符号的方法。 8421(BCD)码 将十进制的每个数字符号用4位二进制数表示 各位的权从左到右分别为8、4、2、1。 用二进制数的0000~1001来分别表示十进制的0~9。 主要特点:有权码、编码简单直观 (91.76)10 = (1001 0001 . 0111 0110)BCD (0110 0000 0001 .0010)BCD =(601.2)10 ;余3码 BCD码+0011 特点:对9的自补码:自身按位取反,可得到对9的补码。 十进制数字5的余3码为1000,5对9之补是9-5=4,而4的余3码是0111,它正好是5的余3码1000按位取反而得。 例如 (90.61)10=(1100 0011 .1001 0100)余3 2421码 有权码,权从左到右分别为2、4、2、1 ;十进制数 ; 什么是信息? 定义:信息是事物运动状态或存在方式的不确定性的表述 属性: 事实性、不完全性、时效性 计算机中的信息 数据 不同的信息如何表示?;;信息编码;用于信息表示的符号系统 存在一个基本的有限符号集,符号数大于1,不同符号有明显差别 存在一组规则,按照规则可以将基本符号组合成更复杂的结构 语义符号化表达 语义符号化:是指将现实世界的语义用符号表达,进而进行基于符号进行计算的一种思维 将符号赋予不同语义,则能计算不同的现实世界问题。 ;《易》 基本符号 阴/阳 编码规则:阴阳的位置与组合 “乾” “坎” “艮”“震” “巽” “离” “坤”“兑” 如果将基本符号阴换成0,阳换成1 乾 111 坎010 艮100 震001 …… ;规则变化:更复杂、更多组合,更多语义 从例子可以得出: 非数值性信息也可以用0,1编码表示 表示的信息越复杂,需要的编码长度越长 编码规则必须为通信双方公认 ;编码:以若干位数码或符号的不同组合来表示非数值性信息的方法, 人为地将若干位数码或符号的每一种组合指定一种唯一的含义 编码的主要特征 唯一性:每一种组合都有确定的唯一性的含义 公共性:所有相关者都认同、遵守、使用这种编码 规律性:易于记忆、识认 ;字符信息的编码 计算机只能识别二进制数,让计算机能够存储处理字符信息,必须将其数字化。 西文字符 ASCII,7位 ANSI(American National Standards Institue),8位 Unicode(Universal Multiple-Octet Coded Character Set),16位。 中文字符 ;ASCII码美国标准信息交换码 标准的ASCII码使用7位二进制数编码 标准的ASCII码可以表示128个字符,其中包含10个阿拉伯数字,52个英文大小字母,33个符号及33个控制字符。 例如,字母‘A’的ASCII编码是‘65’,对应的十六进制值是‘41H’,在一个字节中的表示是: ;;Unicode统一码 为了解决传统的字符编码方案的局限:各自标准,难以转换 为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求 标准包括字符集、编码方案等 编码结构 :32位 组(7bit ,最高位为0) 面(8位) 行(8位) 格(位);举例:网页乱码;汉字信息编码困难的原因 数量庞大 字形复杂 存在大量一音多字和一字多音的现象 汉字的输入、存储、输出不能像西文字符一样只用一种编码。 汉字处理过程: 通过汉字外码输入,以汉字内码存储,以汉字字形码输出 ;输入码 用键盘上的字母符号编码汉字 通过键入字母符号代替键入汉字,如“国标区位码”、“全拼”、“五笔”、“搜狗拼音”等。 ;汉字国标码(输入码) 国家标准GB2312-80编码字符集,称为国标码,每个汉字采用双字节编码,每个字节使用低7位,最高位为0。 ;汉字机内码:计算机系统内部为存储、处理和传输汉字而使用的编码 在汉字国标码的基础上把每个字节的最高位由0变1,其他位不变 将汉字国标码用于计算机内部存储传输,则汉字国标码的每个字节和标准ASCII码就没法区别了 向下兼容的编码方法 从ASCII、GB2312、GBK到GB18030,编码方法是向下兼容的 同一个字符在这些方案中的编码相同 ; ;输出码:又称字型码 ; ;思考:给26个英文字母编码,如何设计?考虑哪些因素? 使用定长编码 使用变长编码 设计一个4位的二

文档评论(0)

1亿VIP精品文档

相关文档