- 4
- 0
- 约7.05千字
- 约 59页
- 2017-10-23 发布于河南
- 举报
编码大全
拔赤 bachi@
2010-04-23
• 编码之初
• ASCII
• 国际化
• 第二种国际化
• HTTP之URL编码
• HTTP之BASE64编码
• 字体
• 编码之初
• 编码之初
• ASCII
• 国际化
• 第二种国际化
• HTTP之URL编码
• HTTP之BASE64编码
• 字体
• 编码之初
编码之初 – 之初
• 摩尔斯码
– 单位是“位”(长短音)
• 01 - A
• 1000 - B
• 1010 - C
• 输入法编码
– 单位是“字符”
• VRM - 淘 (郑码)
• IQRM - 淘 (五笔)
• 4452 - 淘 (区位)= GB2312
编码之初 – 01编码
• 计算机内码
– 01编码
– 编码单位“字”
• 2A - *
• 30 - 0
• 41 - A
• 6DD8 - 淘 (unicode)
• CCD4 - 淘 (gbk)
• B25E - 淘 (big5)
• 编码之初
• ASCII
• 国际化
• 第二种国际化
• HTTP之URL编码
• HTTP之BASE64编码
• 字体
• 编码之初
ASCII – 最初的128个字符
• 长度
– 一个字 (8位)
– 最高位用作校验位 27 = 128
• 范围
– 00 ~ 7F
• 编码之初
• ASCII
• 国际化
• 第二种国际化
• HTTP之URL编码
• HTTP之BASE64编码
• 字体
• 编码之初
国际化 – 扩充ASCII
• ISO8859 编码标准集合
ASCII ISO8859-1 德法(Latin-1)
ASCII ISO8859-2 东欧(Latin-2)
ASCII ISO8859-6 阿拉伯(Arabic)
ASCII ISO8859-7 希腊(Greek)
…
ISO8859 (拉丁字符集)
• 子集的不兼容
– D9 - Ù (ISO8859-1)西欧
– D9 - Ω (ISO8859-7)希腊
• 单字节 0 ~ 255
• ISO8859不兼容东亚字符
国际化 – 再次扩充ASCII
• 东亚字符集
ASCII GB2312-80 简体中文
ASCII BIG5 繁体中文
ASCII SJIS 日文
…
东亚字符集 -ISO8859的悲剧重演
• 子集的不兼容
– B8A1 - 腹 (BIG5)繁体中文
– B8A1 - 浮 (GB2312)简体中文
• 双字节
• 与ISO8859各编码集不兼容
导致的悲剧
• 一段文本无法同时使用多种语言
• 一段文本无法同时使用简体和繁体
GB
原创力文档

文档评论(0)