信息表示技术基.pptVIP

  • 0
  • 0
  • 约1.24万字
  • 约 77页
  • 2017-02-05 发布于湖北
  • 举报
* 中山大学计算机科学系 2.4 字符编码技术 UCS-2码只对BMP中的代码点进行双8位编码,共有216=65,536个代码点。例如 “A” U+0041 “€” U+20AC “汉” U+6C49。 UCS-2码基本上可以容纳所有的欧美字符和绝大部分的亚洲字符,因此,UCS-2字符集被普通支持。 小提示:在Word中,将输入点移至某个字符的右侧,按下Alt+X,该字符就转换为Unicode代码点,再按则转换回原字符 * 中山大学计算机科学系 2.4 字符编码技术 2.4.5.2 UTF编码 UTF是对Unicode字符集编码的实现方案,为每个Unicode字符给出机内表示格式, Unicode 字符的机内码 UTF规范定义了三种编码格式,即UTF-8、UTF-16和UTF-32,它们都能够正确地编码任何Unicode代码点。其中,UTF-8和UTF-16被广泛使用,而UTF-32很少使用。 * 中山大学计算机科学系 2.4 字符编码技术 一、UTF-32 UTF-32码是定长码,使用1个32位(即4字节)编码单元表示每个等值的Unicode代码点。例如,字符“A”的代码点U+41用4个字节表示等值的无符号整数41H。

文档评论(0)

1亿VIP精品文档

相关文档