- 1、本文档共138页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第1章计算机与信息技术概述概要
* * * * * * * * * * * * * * * 计算机又称为“电脑” * * * * * * * * 1)西文字符的表示方法 西文字符包括拉丁字母、数字、标点符号及一些特殊符号,统称”字符”。所有字符的集合称为“字符集”。 字符集中每个字符对应一个代码,构成编码表,简称码表。 1)西文字符的表示方法 目前计算机中使用最广泛的西文字符集是ASCII字符集,其全称是“美国信息交换标准代码”。 标准ASCII用7位进行编码,在计算机中存储时1个字符占1个字节,最高位为0,可表示128个字符,具体参见P15表1.3。 特殊字符的ASCII码 空格(32D,20H) A(65D,41H) a(97D,61H) 0~9 (48D~57D,30H~39H) 基本的ASCII字符集共有128个字符,其中包括: 95个可打印字符 33个控制字符 1)西文字符的表示方法(续) 扩展ASCII用8位编码,最高位可以为0,也可以为1,最多可表示256个字符。 2)汉字的表示方法 (1)汉字输入码 好的汉字键盘输入编码方案的特点:易学习、易记忆、效率高、重码少、容量大等。 输入编码方法的分类: 字音编码:智能ABC、微软拼音、全拼 字形编码:五笔形 形音编码 数字编码:电报码、区位码等 (2)汉字机内码 (一)汉字编码标准 ①GB2312汉字编码(1981年颁布,第一个国家标准),《信息交换用汉字编码字符集·基本集》(GB2312-80),无繁体字,包括3部分: 第1部分:字母、数字和各种符号共682个 第2部分:一级常用汉字3755个,按拼音排列 第3部分:二级常用字3008个,按部首排列 总共7445个,汉字6763个 2)汉字的表示方法 GBK全称为《汉字内码扩展规范》,是1995年发布的一个汉字编码标准,共有21003个汉字,它与GB2312国标汉字字符集及其内码保持兼容,有繁体字。 GBK目前已被广泛应用,WINDOWS操作系统和OFFICE软件均支持GBK代码。 ②GBK汉字内码扩充规范 2)汉字的表示方法 UCS/Unicode是国际标准组织ISO制定的用以将全世界所有字符和符号集中统一编码的标准,称为UCS-2。 UCS-2是双字节编码,共有字符49194个,其中包括中、日、韩(CJK)统一编码的汉字。 ③UCS/Unicode与GB18030汉字编码标准 2)汉字的表示方法 2)汉字的表示方法 ④我国政府在2000年又颁布了一个新的汉字编码标准GB18030、GB18030-2000编码标准在GB2312和GBK的基础上进行扩充,增加了4字节编码,包含汉字27000多个,和GB2312和GBK兼容,而且与台湾、香港地区使用的BIG5码相兼容。 ①区位码:GB2312的所有字符分布在一个94行94列的平面内,行号为区号,列号为位号。每一个汉字用它所在的区号及位号来表示。每个区号和位号分别用1个字节来表示,称为区位码。 如:“大”字的区号20,位号83,区位码是2083 (1)汉字机内码生成方法 2)汉字的表示方法 ②国标交换码: 每个汉字的区号和位号分别加上32后得到国标交换码,简称国标码或交换码。 如:“大”字的区号位号分别加上32后得到52 115,将其分别转换为一个字节的二进制码后,得到其国标码是:01110011。 2)汉字的表示方法 ③ 机内码: 将国标码的两个字节的最高位置为l后得到的编码称为GB2312汉字的“机内码”,又称内码。 如:“大”字的国标码为: 01110011, 其机内码为:11110011 (转换为十六进制后为B4F3) 2)汉字的表示方法 几种汉字编码的对比 GB2312 GBK GB18030 UCS-2 (Unicode) 6763个汉字(简体字) 21003个汉字(包括GB2312汉字在内) 27 000多汉字(包括GBK汉字和CJK及其扩充中的汉字) 2万多汉字 双字节存储和表示,每个字节的最高位均为“1” 双字节存储和表示,第1个字节的最高位必为“1” 部分双字节、部分4字节表示 (UTF-8编码) 1字节、2字节、3字节等不等长编码 注意:在同一台机器上,即使使用不同的输入码向计算机输入同一个汉字,其内码是相同的。 2)汉字的表示方法 文本字形描述方法:点阵字形和轮廓字形 3)字符的显示 点阵描述 轮廓描述 轮廓点 直线 二次曲线 汉字输出时,若使用16×16点阵的表示方法,则需要16b×16b=256bit=32B 3)字符的显示 同一种字体的所有字符的形状描述信息构成字库。 不
文档评论(0)