Java字符编码全解.pdfVIP

  • 14
  • 0
  • 约2.37万字
  • 约 13页
  • 2018-05-15 发布于河南
  • 举报
Java字符编码全解

1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以中文两个字为例,经查表可以知道其GB2312编码是d6d0 cec4,Unicode 编码为4e2d 6587,UTF编码就是e4b8ad e69687。注意,这两个字没有iso8859-1编码,但可 以用iso8859-1编码来表示。 2. 编码基本知识 最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编 码,重要的有如下几个。 2.1. iso8859-1 属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机 最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用 该编码。比如,虽然中文两个字不存在iso8859-1编码,以gb2312编码为例,应该是d6d0 cec4 两个字符,使用iso8859-1编码的时候则将它拆开为4个字节来表示:d6d0cec4(事实上,在进行 存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节e4 b8 ad e6 96 87。 很明显,

文档评论(0)

1亿VIP精品文档

相关文档