网站大量收购独家精品文档,联系QQ:2885784924

1.3文字符号在计算机中的表示和处理.doc

1.3文字符号在计算机中的表示和处理.doc

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.3文字符号在计算机中的表示和处理

1.3 文字符号在计算机中的表示与处理 1.3.1 西文字符的编码 西文是由拉丁字母、数字、标点符号及一些特殊符号所组成的,它们统称为字符。所有字符的集合称为字符集。字符集有多种,每一字符集的编码方法也多种多样。目前计算机中使用最广泛的西文字符集及其编码是ASCII码,即美国标准信息交换码。每个字符都由7个二进位b6b5b4b3b2b1b0表示。 ASCII码是7位的编码,但由于字节是计算机中的基本处理单位,故一般仍以一字节来存放一个ASCII字符。 1.3.2 汉字的编码 1. GB 2312汉字编码 1981年我国颁布了第一个汉字编码的国家标准——《信息交换汉字编码字符集·基本集》(GB 2312)。该标准选出6 763个常用汉字和682个非常用汉字字符,为每个字符规定了标准代码,这个标准所收集的字符及其编码为国标码,又称为国标交换码。 GB 2312国标字符集由3部分组成。第一部分是字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个;第二部分为一级常用汉字,共3 755个,按汉语拼音排列;第三部分为二级常用汉字,共3 008个,因不太常用,所以按偏旁部首列。 GB 2312的所有字符分布在一个94行×94列的二维平面内,行号称为区号,列号称为位号。区号和位号的组合就可以作为汉字字符的编码,称为汉字的区位码。 区号和位号各用8个二进位表示,它们的最高位均设置为1。这样得到的高位匀为1的双字节汉字编码就称为GB 2312汉字的“机内码”,又称为内码。PC中GB 2312汉字的表示都采用这种方式。 2.GBK汉字内码扩充规范 GBK是我国1995年发布的又一个汉字编码标准,全称为《汉字内码扩展规范》。 2.UCS/Unicode与GB 18030编码标准 UCS/Unicode规定,全世界现代书面文字所使用的所有字符和符号都集中在一个字符集中统一进行编码。目前的做法是采用双字节编码。 1.3.3 计算机中的文字处理 1.文稿的输入 汉字输入的编码方法大体可分成以下4类: 数字编码。 字音编码。 字形编码。 音形混合编码。 2.文本的编辑与排版 文本编辑就是对已输入的文字内容进行增加、删除或修改,直到满意为止。使用文字处理软件(如Word、WPS等)。 3.文档的存储与输出 制作的文档可以多种不同的文件格式在外存储器上进行存储。 doc:微软公司专用的Word文档格式 .txt:纯文本格式 .rtf:丰富文本格式 .html:超文本标记语言格式 .xhtml:超文本标记语言单个文件格式 .xml:扩展标记语言格式

文档评论(0)

ktj823 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档