- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
汉字编码表示与显示
汉字编码表示与显示
一、汉字的编码
1981 年5 月,我国国家标准总局颁布了《信息交换用汉字编码字符集》
(GB2312-80 ),简称国家标准汉字编码,也叫国标码。国标码共收进标准字符
7445 个。其中一级汉字3755 个,二级汉字3008 个,共计6763 个汉字。 由于
汉字的字符多,一个字节即 8 位二进制代码不足以表示所有的常用汉字。同时
为了不与西文的ASCII 码混淆,汉字国标码的每个汉字或符号都使用2 个字节
(16 位二进制)代码来表示。 西文字符采用一个字节表示,即ASCII 码,一般
只用七位来表示128 个字符,而把最高位用作奇偶校验(或者不用) 。
国标码介绍:在GB2312-80 代码表中,纵向分为0~93,共94 行;横向
也是0~93,共94 列。行与列分别用b7b6b5b4b3b2b1 七 位二进制码表示,第一字
节表示行,第二字节表示列。其值从 0100001 到 1111110 (十六进制为21-7E )。
这正是ASCII 码的可打印字符的编 码范围。国标码是将第一字节和第二字节连
写而得。由于二进太长,一般用十六进制表示。
区位码介绍:在国标GB2312-80 中,国标码除了用双七位二进制表示
外,还可以表示成区位码的形式。即在国标代码表中,将行号称为区号,列号
称为位号,分别有 94 个区和 94 个位。区号和位号用十进制表示,不足两位前
面补0 。这样每个汉字或符号都可用4 位十进制表示。区位码因此可以用来作输
入码。是汉字输入的基本编码方法之一。
机内码介绍:在计算机中双字节汉字与单字节西文字符混合使用、处
理,汉字编码的各个字节若不予以特别标识,就会与单字节的 ASCII 码混淆不
清;为此,将标识汉字的两个字节编码的最高位置为1,这种最高位为1 的双字
节汉字编码就是中国大陆普遍采用的汉字机内码,简称内码,是计算机内部存
储、处理汉字所使用的代码。
内码、国标码、区位码三者的关系是:
高字节内码=高字节国标码+80H=区码+20H+80H=区码+0A0H=区码+160
低字节内码=低字节国标码+80H=位码+20H+80H=位码+0A0H=位码+160
繁体汉字在一些地区和领域仍在使用,国家又制定出相应的繁体汉字
字符集,国家标准代号是GB12345-90“信息交换用汉字编码字符集——辅助集”,
包含了 717 个图形符号和 6866 个繁体汉字。BIG5 是我国台湾地区计算机系统
中使用的汉字编码字符集,包含了420 个图形符号和 13070 个繁体汉字(不用
简体字)。
二、汉字的字模库
汉字的输出主要是指汉字字形的输出。输出的方式主要是显示和打印
两种。汉字输出时,用一个点阵来表示一个汉字。点阵的每个点位只有两种状
态:有点或无点。若用二进制代码来表示即为该位取值为 1 表示有点,取值为
0 表示无点。汉字的输出原理与西文的输出原理是相同的。不同的是汉字笔划较
多,要能很好地表示一个汉字,起码需要16×16 点阵才行。如果要求字型逼真
美观,点阵的点数还要增加。如用24 ×24 、32 ×32、48 ×48 等,因此汉字的存
储空间比西文要大很多,需要用大量的存储空间来存放字模。
描述一个汉字点阵信息的二进制代码串称为汉字的“字模”。所有汉字
和各种符号的点阵信息就组成汉字的“字模库”(简称字库)。字模的表示顺序
为:先从左到右,再从上到下。也就是先画第一行左上方的 8 个点,再是右上
方的8 个点,然后是第二行左边8 个点,右边8 个点,以此类推。
三、汉字的显示原理
1. 从键盘输入的汉字经过键盘管理模块,变换成机内码。
2. 然后经字模检索程序,查到机内码对应的点阵信息在字模库的地址。
3. 从字库中检索出该汉字点阵信息。
4. 利用显示驱动程序将这些信息送到显示卡的显示缓冲存储器中。
5. 显示器的控制器把点阵信息整屏顺次读出,并使每一个二进制位与屏幕的一
个点位相对应,就可以将汉字字形在屏幕上显示出来。
四、用区位码获取汉字的点阵信息
以16×16 的点阵汉字库文件为例。一个汉字用了256 个点共32 个字
节表示。汉字共分 94 区,每个区有94 位汉字。机内码用两个字节表示,第一
个字节存储区号(qh ),为了和ASCII 码相区别,范围从十六进制的A1H 开始
(小于80H 地为ASCII 码字符),对
您可能关注的文档
- 模电指导书(7-10).DOC
- 横断山北部生态脆弱区土壤磷素空间分布特征-生态学报.PDF
- 模型建立与求解问题一:1蚁群算法成本.PPT
- 模组化自动测试系统设计与实现Automated Test System Design and.PDF
- 横向超声随焊控制铝合金焊接热裂纹倾向数值模拟研究-西北有色金属.PDF
- 模拟电路模拟试卷A答案.DOC
- 橙黄后窗网蛾的生物学初报-应用昆虫学报.PDF
- 橡胶弹性体和液晶弹性体 - 中国物理C.PDF
- 橙黄瑞香中苯丙素类成分研究.PDF
- 模拟电子技术基础第九章习题.DOC
- 《GB/Z 44363-2024致热性 医疗器械热原试验的原理和方法》.pdf
- GB/T 16716.6-2024包装与环境 第6部分:有机循环.pdf
- 中国国家标准 GB/T 44376.1-2024微细气泡技术 水处理应用 第1 部分:亚甲基蓝脱色法评价臭氧微细气泡水发生系统.pdf
- 《GB/T 44376.1-2024微细气泡技术 水处理应用 第1 部分:亚甲基蓝脱色法评价臭氧微细气泡水发生系统》.pdf
- GB/T 44376.1-2024微细气泡技术 水处理应用 第1 部分:亚甲基蓝脱色法评价臭氧微细气泡水发生系统.pdf
- 中国国家标准 GB/T 44315-2024科技馆展品设计通用要求.pdf
- GB/T 44305.2-2024塑料 增塑聚氯乙烯(PVC-P)模塑和挤塑材料 第2部分:试样制备和性能测定.pdf
- 《GB/T 44315-2024科技馆展品设计通用要求》.pdf
- GB/T 44315-2024科技馆展品设计通用要求.pdf
- GB/T 39560.9-2024电子电气产品中某些物质的测定 第9 部分:气相色谱-质谱法(GC-MS)测定聚合物中的六溴环十二烷.pdf
文档评论(0)