Java的编码.docVIP

  • 2
  • 0
  • 约1.02万字
  • 约 9页
  • 2017-05-09 发布于河南
  • 举报
Java的编码

java encoding参考1. 概述 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。 在下面的描述中,将以中文两个字为例,经查表可以知道其GB2312编码是d6d0 cec4,Unicode编码为4e2d 6587,UTF编码就是e4b8ad e69687。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来表示。 2. 编码基本知识 最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。 2.1. iso8859-1 属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。 很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然中文两个字不存在iso8859-1编码,以gb2312编码为例,应该是d6d0 cec4两个字符,使用iso8859-1编码的时候则将它拆开为4个字节来表示:d6 d0 ce c4(事实上,在进行存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节e4 b8 ad e6 96

文档评论(0)

1亿VIP精品文档

相关文档