西文字符编码与汉字编码.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
西文字符编码与汉字编码

授课内容:西文字符编码与汉字编码 ξ1.2西文字符编码与汉字编码 一、ASCII(西文字符编码) 我国于1980年颁布了《信息交换用汉字编码字符集·基本集》,简称GB2312-80码 (国标码)。 区位码:使用了两个字节,最高位均置0 (二)、汉字编码: 对汉字进行编码是为了使电脑能够识别并处理汉字,在汉字处理的各个环节中,由于要求不同,采用的编码也不同。 汉字输入过程: 汉字的输入码 汉字的输入码:是为用户能利用西文键盘输入汉字而设计的编码。主要有以下四种: ①数字编码:如电报码、区位码。 ②字音编码:如双拼、全拼输入方案。 ③字形编码:如五笔字形码、表形码。 ④音形编码:根据语音和字形双重因素确定的输入码。 国标码 (1)汉字信息交换码:国家标准汉字编码简称国标码,主要用于不同系统之间汉字信息的存储与交换。GB2312-80编码集规定了计算机使用汉字和图形符号总数为7445个。 (2)一个汉字的编码由两个字节组成,第一个字节称为“区”,第二个字节称为“位”,这就是区位码。国标码最多可组成94区×94位,组成一个94×94的矩阵。 在此方阵中,每一行称为一个“区”,每一列称为一个“位”。 共收录了汉字和图形符号7445个,每个汉字用两个字节表示。汉字分为两级:一级汉字3755个,按汉语拼音字母排列;二级汉字3008个,按部首排列;非汉字字符682个。 ⑶汉字的内码:是汉字在计算机内部存储、处理的代码。英文字符的机内码是最高位为0的8位ASCⅡ码,而汉字字符的机内码是两个字节的最高位都为1的ASCⅡ码。即将国标码的每字节最高位置1作为汉字机内码。公式为:   区位码+2020H=国标码 国标码+8080H=机内码 或:区位码+A0A0H=机内码 例如:汉字“中”的区位码是3630H,它的国标码是(5650H),机内码是( D6D0H )。 汉字机内码每个字节的最高位均是1,而西文字符机内码(ASCII)的最高位是0 汉字字形码 汉字字形码(输出码)(字模) 汉字的输出码:提供输出汉字时的需要的汉字字形,用以将机内码还原为汉字进行输出。汉字字形码是一种汉字字模点阵的二进制码,是汉字的输出码。 我国已颁布了16×16、24×24、32×32和48×48点阵的字模标准。汉字显示一般用16×16的点阵,而24×24以上的点阵一般用于打印。 点阵越大精度越高所需要的存储单元越多打印出的字也越清析。 N个汉字点阵为a×b共需要多少存储空间M:(N*A*B)/8 一、填空题:   1、ASCII码是____位二进制字符编码,是__________的缩写,共有__个不同的字符编码,其中包括10个阿拉伯数字、___个英文大小写字母、___个符号和运算符以及___个控制符,____符是不能显示的,其余95个是可显示(打印)的ASCII码。  2、GB2312,简称______,共收纳___个汉字,其中一级汉字有___个,二级汉字有____个,并且一级汉字按_______顺序排列,二级汉字按_______排列。根据GB2312的编码方法,把该码分成___个区,每个区分成___个码位。  3、比较以下两个ASCII值的大小:   “0”___“S”  “3”___“8”   “A”___“C”?  “A”___“a”  4、每一个点在存储器中用____个二进制位(bit)存储,所以一个16×16点阵汉字需要____个字节存储空间。 二、计算题:  1、“啊”汉字的区位码为1601,求这汉字的国标码和机内码。  2、已知某汉字区号34,位号56,求某汉字的国标码和机内码。   * * ξ1.2西文字符编码与汉字编码 编码 定义:用二进制数0、1的不同组合 来表示特定的信息。 版本:7位版本(使用了一个字节中的7位,最高位置0, 数值范围从0000000~1111111,即0~127,共计 128个字符。 全称:美国标准信息交换代码(American Standard Code for Information Interchange) ASCII码对照表: ξ1.2西文字符编码与汉字编码 一、ASCII 128个字符包括: (一)、 94个可显示打印字符。 数字0~9:(48~57)——————— 10个 大写英文字母A~Z:(65~90)————26个 小写英文字母a~z:(97~122)———26个 标点符号和运算符号———————— 32个 (二)、34个不可显示字符。 控制字符:空格:32 DEL:127 课堂

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档