- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2014冲剌班计算机复习要点(第五讲)
2014冲剌班计算机复习要点(第五讲)
多媒体
一、文本及文本处理
文本准备(即:文本输入)、文本编辑、文本处理、文本传输、文本展现(即:文本输出)。
组成文本的基本元素是____字符____。
常用字符的集合称为______字符集_____。
二、字符编码
1、ASCII码
美国标准信息交换码是________ASCII 码/___________。
以下数据要记住:基本ASCII字符集中数据:
96个可打印字符。32个控制字符。共128个。
字符‘A’的ASCII码值是:65
字符‘a’ 的ASCII码值是:97
数字‘0’字符ASCII码值是:48
目的:用于计算题。如:’A’是65,求’d’ASCII码值
空格字符ASCII码值是:32
一个标准ASCII字符需要7位二进制位表示。在内存中存储时要占用一个字节,即8位,但只用到7位,最高位总是0。
2、汉字编码
①GB2312-80一共分94区、94位。
第一部分:字母、数字和各种符号共682个。称为GB2312图形符号。如:汉字的标点符号、全角方式下的英文字符如’A’。都是两个字节,而且高位都是1。
第二部分:一级常用汉字(共3755个),按汉语拼音排列
第三部分:二级常用汉字(共3008个),按偏旁部首排列
汉字一共有:3755+3008=6763个。
没有繁体字。与ASCII码不兼容(因为:ASCII是最高位为0,而一个汉字是2个字节,它们的最高位都是1)
汉字区位码:汉字‘啊’在16区1位上,故:汉字‘啊’的区位码是:16 01 (两个字节)。区位码是汉字输入码。
汉字国标码:由区位码中的区+32、位+32得到。如:汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。国标码用于不同系统间交流用。
汉字机内码:是汉字输入到电脑后的编码。在计算机内部处理汉字时,都是使用机内码进行的。(汉字在内存中、存储在硬盘等外存中都是使用的机内码)
国标码每一个字节加上128(即:每一个字节高位置1),就是机内码。
如: 汉字‘啊’的区位码是:16(区) 01(位),则国标码是:48 33 (两个字节)。则相应机内码是:48+128=176 33+128=161 ,因此汉字‘啊’的机内码是:176 161 (两个字节且高位都是1)
归纳:区位码=?机内码:区+160 位+160
区位码=?国标码:区+32 位+32
国标码=?区位码:字节-32 字节-32
机内码=?区位码:字节-160 字节-160
国标码=?机内码:字节+128 字节+128 (等价于高位置1)
机内码=?国标码:字节-128 字节-128
注意:若是用十六进制计算,A0就是十进制的160.
测试:若中文Windows环境下西文使用标准ASCII码,汉字采用GB2312编码,设有一段文字的内码为CB F5 D0 B4 50 43 CA C7 D6 B8,则在这段文字中,含有多少个汉字和多少个西文字符
思路:因为:一个汉字是两个字节且高位都是1. 因此:CB F5(这两个字节CB F5高位都是1,因而是一个汉字) D0 B4 (这两个字节D0 B4高位都是1,因而是一个汉字)50(一个英文字符) 43(一个英文字符) CA C7(一个汉字) D6 B8(一个汉字)。结果:4个汉字,2个英文字符。
②GBK:在GB2312基础上扩充了大量汉字。包括大量繁体。大约2万1千多个汉字。因此:GBK向下兼容GB2312,
与GB2312相同的字符,其编码保持相同。(一个汉字2个字节,且高位都是1)
新扩充的符号与汉字,则也是2个字节,第1个字节高位必须是1,第2个字节的高位可以是0也可以是1。
与ASCII码仍不兼容。
③GB18030:对UNICODE中的10万个字符重新按我国情况进行编码。向下兼容GBK(自然也就兼容GB2312了)。是不等长编码。即:单字节编码表示ASCII字符,双字节编码表示汉字(向下兼容GBK),大约2万3千多个汉字,四字节编码表示其它字符。向下兼容ASCII(因为是不等长编码)。与UNICODE不兼容。
④台湾繁体BIG5: 与所有的GBXXX标准都不兼容。
⑤UNICODE中的UTF-8编码(与GB18030编码的字符集是一样的,即:字符相同,但编码的方式不同): UTF-8编码也是不等长编码。与GB系列编码都不兼容,但与ASCII码兼容。
⑥ISO将全球所有文字字母和符号集中在一个字符集中进行统一编码,称为__UCS标准___
对应的工业标准称为____Unicode____,它的实现有____UTF-8_______和__
文档评论(0)