- 4
- 0
- 约9.48千字
- 约 7页
- 2016-05-24 发布于河南
- 举报
常用字符集介绍和编码转换原理
1. GB2312编码介绍 1
1.1 基本信息 1
1.2 GB标准 1
1.3 分区表示 1
1.4 字节结构 1
2. 通用字符集UCS 2
2.1 定义 2
2.2 概要 2
2.3 实现级别 2
2.4 与UNICODE的兼容关系 2
3. unicode编码介绍 3
3.1 基本简介 3
3.2 编码实现 3
3.2.1 编码方式 3
3.2.2 实现方式 4
4. UTF-8介绍 4
4.1 基本介绍 4
4.2 编码原理 4
4. 转换原理 6
1. GB2312编码介绍
基本信息
《信息交换用汉字编码字符集》是由我国国家标准总局1980年发布,1981年5月1日开始实施的一套国家 汉字编码字符集标准,标准号是GB 2312—1980。它是计算机可以识别的编码,适用于汉字处理、汉字通信等系统之间的信息交换。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。
这个码是唯一的,不会有重码字。把换算成十六进制的区位码加上2020H,就得到国标码加上8080H,就得到常用的计算机机内码。
1995年又颁布了《汉字编码扩展规范》(GBK)。GBK与GB 2312—1980国家标准所对应的内码
原创力文档

文档评论(0)