第二章文本..pptVIP

  • 6
  • 0
  • 约 51页
  • 2016-12-28 发布于山西
  • 举报
UCS 的 代 码 空 间 基本多文种平面(BMP) 辅助平面 专用平面 UCS 的 BMP 平 面 UCS的变形显现形式之一UTF-8 为了与原8-bit系统保持向下兼容,UCS还可以采用8位编码,即采用单字节表示ASCII字符,这种可变长编码称为“UTF-8”(UCS Transformation Form – 8) UTF-8(可变长形式编码), 单字节: ASCII字符(from 20 to 7F) 双字节: Latin等字符(from 80 to 07FF) 三字节: 其它BMP字符 四字节: 其它字符 UTF-8的变换 Unicode Byte1 Byte2 Byte3 Byte4 U+000000-U+00007F 0xxxxxxx U+000080-U+0007FF 110xxxxx 10xxxxxx U+000800-U+00FFFF 1110xxxx 10xxxxxx 10xxxxxx U+010000-U+10FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx UCS的变形显现形式之一UTF-16 为了扩大字符集的容量,在UCS文本中还允许插入一些4字节的UCS-4字符. 在BMP平面中保留了2个有1024个位置的块(D800 到 DFFF),这些位置不能用来表示任何符号, 从每一块中各选一个数字所组成的这些数字对,可用来表示多达

文档评论(0)

1亿VIP精品文档

相关文档