2014冲剌班计算机复习要点(第五讲).docVIP

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014冲剌班计算机复习要点(第五讲)

2014冲剌班计算机复习要点(第五讲) 多媒体 一、文本及文本处理 文本准备(即:文本输入)、文本编辑、文本处理、文本传输、文本展现(即:文本输出)。 组成文本的基本元素是____字符____。 常用字符的集合称为______字符集_____。 二、字符编码 1、ASCII码 美国标准信息交换码是________ASCII 码/___________。 以下数据要记住:基本ASCII字符集中数据: 96个可打印字符。32个控制字符。共128个。 字符‘A’的ASCII码值是:65 字符‘a’ 的ASCII码值是:97 数字‘0’字符ASCII码值是:48 目的:用于计算题。如:’A’是65,求’d’ASCII码值 空格字符ASCII码值是:32 一个标准ASCII字符需要7位二进制位表示。在内存中存储时要占用一个字节,即8位,但只用到7位,最高位总是0。 2、汉字编码 ①GB2312-80一共分94区、94位。 第一部分:字母、数字和各种符号共682个。称为GB2312图形符号。如:汉字的标点符号、全角方式下的英文字符如’A’。都是两个字节,而且高位都是1。 第二部分:一级常用汉字(共3755个),按汉语拼音排列 第三部分:二级常用汉字(共3008个),按偏旁部首排列 汉字一共有:3755+3008=6763个。 没有繁体字。与ASCII码不兼容(因为:ASCII是最高位为0,而一个汉字是2个字节,它们的最高位都是1) 汉字区位码:汉字‘啊’在16区1位上,故:汉字‘啊’的区位码是:16 01 (两个字节)。区位码是汉字输入码。 汉字国标码:由区位码中的区+32、位+32得到。如:汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。国标码用于不同系统间交流用。 汉字机内码:是汉字输入到电脑后的编码。在计算机内部处理汉字时,都是使用机内码进行的。(汉字在内存中、存储在硬盘等外存中都是使用的机内码) 国标码每一个字节加上128(即:每一个字节高位置1),就是机内码。 如: 汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。则相应机内码是:48+128=176 33+128=161 ,因此汉字‘啊’的机内码是:176 161 (两个字节且高位都是1) 归纳:区位码=?机内码:区+160 位+160 区位码=?国标码:区+32 位+32 国标码=?区位码:字节-32 字节-32 机内码=?区位码:字节-160 字节-160 国标码=?机内码:字节+128 字节+128 (等价于高位置1) 机内码=?国标码:字节-128 字节-128 注意:若是用十六进制计算,A0就是十进制的160. 测试:若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设有一段文字的内码为CB F5 D0 B4 50 43 CA C7 D6 B8,则在这段文字中,含有多少个汉字和多少个西文字符 思路:因为:一个汉字是两个字节且高位都是1. 因此:CB F5(这两个字节CB F5高位都是1,因而是一个汉字) D0 B4 (这两个字节D0 B4高位都是1,因而是一个汉字)50(一个英文字符) 43(一个英文字符) CA C7(一个汉字) D6 B8(一个汉字)。结果:4个汉字,2个英文字符。 ②GBK:在GB2312基础上扩充了大量汉字。包括大量繁体。大约2万1千多个汉字。因此:GBK向下兼容GB2312, 与GB2312相同的字符,其编码保持相同。(一个汉字2个字节,且高位都是1) 新扩充的符号与汉字,则也是2个字节,第1个字节高位必须是1,第2个字节的高位可以是0也可以是1。 与ASCII码仍不兼容。 ③GB18030:对UNICODE中的10万个字符重新按我国情况进行编码。向下兼容GBK(自然也就兼容GB2312了)。是不等长编码。即:单字节编码表示ASCII字符,双字节编码表示汉字(向下兼容GBK),大约2万3千多个汉字,四字节编码表示其它字符。向下兼容ASCII(因为是不等长编码)。与UNICODE不兼容。 ④台湾繁体BIG5: 与所有的GBXXX标准都不兼容。 ⑤UNICODE中的UTF-8编码(与GB18030编码的字符集是一样的,即:字符相同,但编码的方式不同): UTF-8编码也是不等长编码。与GB系列编码都不兼容,但与ASCII码兼容。 ⑥ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码,称为__UCS标准___ 对应的工业标准称为____Unicode____,它的实现有____UTF-8_______和__

文档评论(0)

yd327298 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档