网站大量收购闲置独家精品文档,联系QQ:2885784924

FONT KNOWLEDGE 简体中文标准的发展: GB2312-80(1980年制定 .DOC

FONT KNOWLEDGE 简体中文标准的发展: GB2312-80(1980年制定 .DOC

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
FONT KNOWLEDGE 简体中文标准的发展: GB2312-80(1980年制定

FONT KNOWLEDGE 简体中文标准的发展: GB2312-80(1980年制定)--GB2312-90(1990年制定)--GBK(1995年制定) --GB18030(2000年制定); 1. GB2312(简体中文): 此编码为双字节表示,汉字为6763个,汉字从0xB0A1到0xF7FE; 范围是:0xA1A1--0xFEFE; 其中A1--A9为符号区,B0--F9为汉字区; GB2312将代码表分为94个区,对应第一个字节;每个区分为94个位,对应第二个字节;两个字节的值分别是区号码和位号码加0x20,此编码也称为区位码;第一级是常用汉字计3755个,置于-55)区,按汉语拼音字母/笔形顺序排列;第二级汉字是次常用汉字计3008个,置于56-87)区,按部首/笔画顺序排列10-15区、88-94区是有待进一步标准化的空白区 2. GBK(中文扩展编码) 此编码为双字节表示,范围: 0x8140--0xFEFE; 3. BIG5(繁体中文) 此编码为双字节表示;BIG5编码的第一个字节在0xA1到0xF9之间,第二个字节有两个区域,第一个区域在0x40到0x7e之间,另一个区域在0xa1和0xfe之间; 國字的16进制是: 0x87F8; 4. GB18030 此编码分为单字节、双字节和四字节,其与GB2312码和GBK码相兼容; 字节数 码位空间 码位数目 单字节 0x00--0x80 129个 第一字节 第二字节 双字节 0x81--0xFE 0x40--0x7E 23940(比较类似BIG5) 0x80--0xFE 第一 第二 第三 第四 四字节 0x81-0xFE 0x30-0x39 0x81-0xFE 0x30-0x39 1587600 5. 日文编码系统有:JIS X 0208和JIS X 0212, SJIS和EUC; 韩文编码系统有:KSC5601,KSC5657; 6. 点阵字库分为非高点阵字库和高点阵字库;40*40点阵字模(字形码)实际上是40*36; 7. 从点阵字库中读取字模,然后进行显示的方法有: 7.1 在显示汉字的时候,一边从高点阵字库读取汉字的字形码,一边加以 变换在图形方式下进行绘点显示;此方法的缺点是:高点阵字库占用较大 存储空间,高点阵字库一定要存在,但是并不是每台机器都装有高点阵字库; 7.2 另一种方法是:将需要显示的字符串的字形码一次性从高点阵字库中 读出并存放在指定文件中,以后需要显示字符串时直接从指定文件中读取 字模信息;此方法的缺点是:要显示的字符串是固定的字符串,因为从 高点阵字库中读取字模信息只读取一次,以后每次要读取字模信息时直接 从字模信息文件(在以后的操作中是不变的)中进行读取; 8. 在中文环境下输入的是汉字的内码,我们必须将之转换成区位码,算出偏移量 然后从字库中找到对应的汉字; 内码转换成区位码方法(GB2312-80): qh=c1-0xa0, wh=c2-0xa0; 区位码是 : qw = qh*0xff+0xwh; 该汉字在字库中距离起点的位置是: offset = (94*(qh-1) + (wh-1))*32; 9. unicode编码的4E00--9FFF 范围的编码是中文;unicode编码空间的整数范围是从0到10FFFF共1,114,112可用的码点;使用了三种不同的编码格式:8位,16位和32位,相应的编码方案有:UTF-8,UTF-16,UTF-16BE,UTF-16LE,UTF-32,UTF-32BE,UTF-32LE; unicode使用平面来描述编码空间,每个平面分为256行,256列,相对于两字节编码的高低两个字节; 注:CJK :是Chinese Japan Korea首字母的缩写; 10. big5转换成GB2312: GB2312转换成big5: Unicode编码布局 0000..007F; Basic Latin 0080..00FF; Latin-1 Supplement 0100..017F; Latin Extended-A 0180..024F; Latin Extended-B 0250..02AF; IPA Extensions 02B0..02FF; Spacing Modifier Letters 0300..036F; Combining Diacritical Marks 0370..03FF; Greek and Coptic 0400..04FF; Cyr

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档