- 0
- 0
- 约 11页
- 2017-10-02 发布于湖北
- 举报
Web容器的编码问题
Web容器的编码问题
概述
基于 Java 编程语言进行应用开发时,不可避免地要处理中文。Java 编程语言默认的编码方式是 UNICODE,而我们通常使用的数据库及文件都是基于 GBK 编码的,我们经常碰到这样的情况:浏览基于 JSP 技术的网站看到的是乱码,文件打开后看到的也是乱码,被 Java 修改过的数据库的内容在别的场合应用时无法继续正确地提供信息。最早的编码是8859-1,和编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。?8859-1?
属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。很 明显,ISO-8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用 ISO-8859-1编码来表示。而且在很多协议上,默认使用该编码。比如,虽然中文两个字不存在ISO-8859-1编码,以gb2312编码为例,应 该是d6d0?cec4两个字符,使用ISO-8859-1编码的时候则将它拆开为4个字节来表示:d6?d0?ce?c4(事实上,在进行存储的 时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节e4?b8?ad?e6?96?87。很明显,这种表示方法还需要以另一种编码为 基础。?GB2312/GBK?
原创力文档

文档评论(0)