- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大学计算机基础 第二讲 4.3 计算机中数据的表示及其运算 将十进制数表示为二进制编码的形式,称为十进制数的二进制编码,简称二——十进制编码或码。二—十进制编码或BCD(Binary-Coded Decimal)码。 最常用的是8421码,它从4位二进制码中按计数顺序选取从0000开始的前10个码分别表示数字符号0—9。 8421码是一种带权码,4位二进制各位的权值由高到低分别是23,22,21,20,即8,4,2,1,因此而得名。 8421码书写直观,例如十进数1997可写成0001 1001 1001 0111。 须注意,8421码形式上像二进制数,但不是真正的二进制数,与(1997)10等值的二进制数是11111001101B 3)十进制数的二进制编码表示 ----- 14 ----- 15 ----- 13 ----- 12 ----- 11 ----- 10 1001 9 1000 8 0111 7 0110 6 0101 5 0100 4 0011 3 0010 2 0001 1 0000 0 8421码 十进制数 表4.3 8421码 4)汉字编码 汉字是表意文字,其总数超过6万字。对数目繁多的汉字进行编码远比对西文字母的编码复杂得多。 根据汉字处理过程的不同,汉字有多种编码,主要可分为:汉字输入编码、汉字交换码、汉字机内码和汉字字形码。它们在汉字信息处理中的流程如图4.28所示,其中虚线框中的编码是对国标码而言。 图4.28 汉字信息处理系统的模型 汉字输入编码是用字母和数字对汉字进行的编码,目的是为了能使用只有字母和数字键的小键盘,将汉字输入计算机。方法大多是按照汉字的字形,或者字音,或者音形结合来对汉字进行编码的。常用的有拼音编码和五笔字型编码等。 (1)汉字输入编码 汉字国标码也称交换码,是在不同计算机系统之间进行信息交换使用的编码。它是《信息交换用汉字编码字符集基本集》的简称,是我国国家标准总局于1981年颁布的国家标准,编号为GB2312—80。国标码由三部分组成:第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等682个;第二部分为一级常用汉字,共3755个,按汉语拼音排列;第三部分为二级常用字,共3008个,按偏旁部首排列。共计7445 个字符。 (2) 汉字国标码 GB2312—80信息交换编码表,排成一张94×94的图形字符代码表,表2.4是其部分示意。 将表中的行称为区,列称为位。采用两个字节的7位二进制编码表示。以第一字节表示行,第二字节表示列,这就是国标区位码,简称区位码。 两个字节的区位码中每个字节可表示成一个两位的十进制数,这样一个汉字字符的区位码由4位数码组成,例如汉字“啊”,它的区位码是1601,即位于十进制数的第16区、第01位,对应的二进制编码第一字节第二字节 国标码是信息交换编码的十六进制表示形式,国标码与区位码有简单的对应关系:国标码=区位码+2020H。加2020H的目的是使两个字符都避免与ASCII码的控制字符冲突。仍以汉字“啊”为例,对应的二进制数第一字节第二字节即它的国标码是十六进制数3021H。 汉字系统中的机内码在编码时必须考虑到既能与ASCII码严格区分,又与国标GB2312—80汉字字符集有简单的对应关系。采用的方法之一是将表示一个汉字的国标码的2个字节的最高位都设置为“1”。以汉字“大”为例: 国标码为: 3473H 对应的二进制数为: 01110011B 机内码为: B4F3H 对应的二进制数为: 11110011B 由此可见,汉字内码与国标码之间的关系是: 机内码=国标码+8080H=区位码+A0A0H 用2字节的内码可表示汉字的个数是216-2=214=16384,足够覆盖常用的近8000个汉字。 (3)汉字机内码 (4)汉字字形码 汉字是形意文字,要在输出设备上显示一个汉字,通常是把单个汉字离散成网点,每点以一个二进制位表示,由此组成的汉字点阵字形(字模)称为汉字字形码。 例如,一个16×16点阵汉字占16行,每行16个点在存储时用16/8=2个字节来存放,因此,一个16×16点阵汉字占用32个字节。 通常汉字显示使用16×16点阵,汉字打印可选用24×24, 32×32, 48×48等点阵。点数愈多,
文档评论(0)