- 1、本文档共43页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章计算机信息表示与存储
* * 2.3 字符的编码 * * 2.3.2 汉字的编码 汉字是一种象形文字,它的“意”都寓于其“形”和“音”中。如果直接向计算机输入文字和语音虽然可以实现,但远不理想,况且输入装置要做修改。而在计算机内部直接处理、存储文字的字形和语音就更加困难。故处理字符要进行代码化,西文拼音文字代码化比较容易,而汉字由于种类繁多,其编码比拼音文字难得多。汉字信息处理系统在处理汉字和词语时,要进行一系列的汉字代码转换。通过键盘或其他的输入工具输入汉字时,要按一定的编码来进行,这称之为输入码,而在计算机内部存储、处理、传输汉字用的代码称为机内码。而要将汉字输出,用打印机或显示器输出应有一个字形码。 2.3 字符的编码 * * (1) 输入码 目前使用得最多的输入设备就是西文标准键盘, 这种键盘的设计沿用了西文打字机的排列。因而,西文的输入十分方便,想输入什么字符就按什么键。中文输入为了能直接使用西文字符标准键盘,就不可能直接按某键了。中文的字数繁多,字形复杂,字音多变。常用的汉字就有7000多个左右,因此要对汉字设计相应的编码,以便操作人员从键盘上输入代表汉字的编码。这些编码由拉丁字母(如汉语拼音)、数字(区位码)、或特殊符号(五笔字形)构成,千变万化。各种输入方案就是以不同的符号系统来代表汉字进行输入的。目前使用得比较多有区位码、五笔字形码、拼音码、自然码、和智能ABC。 汉字的编码主要分为三类,数字编码,拼音,字形码。 2.3 字符的编码 * * (2) 机内码 机内码是计算机设备内部对信息进行处理、内部存储、传输所用的代码。世界各大计算机公司一般均以ASCII码为内部码来设计计算机系统,西文计算机中没有交换码与机内码之分。而汉字数量多,用一个字节无法区分,一般用2个字节来存放汉字的编码。两个字节共16位,可以表示216=65536个可区别的码,如果两个字节各用7位,则可表示214=16384个可区别的码。一个码代表一个汉字。一般来说,这已够用了,现在我国的汉字信息系统一般都采用这种与ASCII 码相应的8位码方案,用2个8位构成一个汉字机内码。 2.3 字符的编码 * * (2) 机内码 1981年我国颁布了《通用汉字字符集(基本集)及其交换码标准》(国家标准代号为GB2312-80)。这是汉字交换码的国家标准,所以又称“国标码“。该标准收入了6763个常用汉字(其中一级汉字3735个,二级汉字3008个),以及英、俄、日文字与其它符号687个,共有7000多个符号。 国标码规定每个字符由一个2字节代码组成。每个字节的最高位恒为“0”,其余7位用于组成各种不同的码值。两个字节的代码,共可表示128×128=16384个符号,而国标码的基本集目前仅有7000多个符号,所以足够使用。 计算机既要处理汉字,也要处理西文。为了实现中、西文兼容,通常利用字节的最高位来区分某个码值是代表汉字或ASCII 码字符。具体的作法是,若最高位为“1”视为汉字符,最高位为“0”视为ASCII码字符。所以汉字的机内码就在上述的国标码的基础上,把2个字节的最高位一律由“0“改为“1”而构成。 2.3 字符的编码 * * (2) 机内码 机内码是供计算机“识别”所用。而输入码是供用户通过输入装置输入时所用的编码。如用某种编码通过键盘输入的汉字,键盘管理程序将其转换为机内码输入到计算机。供计算机处理,如图1.7所示。 为了统一地表示世界各国的文字,1993年国际标准化组织公布了“通用多八位编码字符集”的国际标准ISO/IEC10646。简称UCS(Universal Code Set),USC中包含了中、日、韩等国文字,这一标准为包括汉字在内的各种正在使用的文字,规定了统一的编码方案。该标准是用4个8位码(四个字节)来表示一个字符。我国相应的国家标准为GB13000。 2.3 字符的编码 * * (3) 汉字字型码 在汉字输出时用显示器显示,用打印机打印,这就需要用到汉字字型码。汉字字型码是汉字字型的字模数据。通常用点阵、矢量函数等方式来表示,用点阵表示字型时,汉字字型码就是这个汉字字型点阵的代码。字型码也称字模码,是用点阵表示的汉字字形代码,它是汉字的输出形式,根据输出汉字要求不同,点阵的多少也不同。通常汉字显示用16×16点阵,汉字打印可选用24×24、32×32、48×48等点阵,点数越多,打印的字体越美观。但汉字库占用的存储空间也越大。如一个24×24的汉字占用空间为72B,而48×48的汉字将占用48×6=288B。 2.3 字符的编码 00,80 00,80 20,80 10,80 11,FE 20,10 21,08 22,04 0C,03 汉字内码 1
您可能关注的文档
最近下载
- 10组织机构设置及管理方案人员配备.doc VIP
- 外研版(三起)(2024)三年级上册英语Unit 4 Fun with numbers单元测试卷(含答案).docx VIP
- 外科感染、抗菌药物的合理应用.pptx
- 数字媒体技术在视觉传达设计中的体现与应用.docx VIP
- 21-骑文探古访百村:乐平镇大旗头村.docx VIP
- 《义务教育英语课程标准(2022年版)》新旧变化对比.pdf VIP
- 呼吸衰竭护理查房宋双双_图文.ppt VIP
- 社区工作者考试试题库300道附参考答案(精练).docx VIP
- NE200300高性能矢量变频器用户手册.pdf VIP
- 太原市第一外国语学校小语种考试真题及答案.pdf VIP
文档评论(0)