专题1:Java乱码的解决.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题1:Java乱码的解决剖析

Java乱码的解决方案 2015.4 乱码的出处 开发者所用的操作系统 jdk的名称、版本 数据库的名称、 版本(精确版本)以及jdbc驱动的版本 出现乱码的源代码 字符集 ASCII:是一个原始的字符集,而且是到目前为止最通用的,是所有字符集必须支持的最主要部分。基本上只定义了书写英语需要的全部字符,这些字符的编码是0~127。 Unicode字符集:是一个双字节字符集,能表示多种文字和几百种语言中的40,000多个不同字符。 ISO字符集:国际标准组织(ISO)定义了几个不同的字符集,是在ASCII码基础上增加了其他语言和地区需要的字符。其中最突出的是ISO8859-1(Latin-1),Latin-1包括了书写所有西方欧洲语言不可缺少的附加字符,其中0~127的字符与ASCII码相同。 UTF-8:是一个压缩的Unicode版本,使用单个字节表示最常用的字符,即0到127的ASCII字符,较少见的字符使用三个字节表示,如汉字。 GB2312:中国国家标准的简体中文字符集,所收录的汉字已经覆盖99.75%的使用频率,基本满足了汉字的计算机处理需要,在中国大陆和新加坡获广泛使用。(GB18030,GBK,BIG5) 常用字符集 字符集名称 语言/国家 US-ASCII 英语 UTF-8 压缩Unicode UTF-16 压缩UCS ISO-10646-UCS-2 原始Unicode ISO-10646-UCS-4 原始UCS ISO-8859-1 Latin-1,西欧 ISO-8859-2 Latin-2,东欧 ISO-8859-3 Latin-3,南欧 ISO-8859-4 Latin-4,北欧 ISO-8859-5 ASCII码加古斯拉夫语 ISO-8859-6 ASCII码加阿拉伯语 ISO-8859-7 ASCII码加希腊语 ISO-8859-8 ASCII码加希伯来语 ISO-8859-9 Latin-5,土耳其语 ISO-8859-10 Latin-6,ASCII码加北欧语 ISO-8859-11 ASCII码加泰国语 ISO-8859-13 Latin-7,ASCII码加波罗地海周边语言和独特的拉托维亚语 ISO-8859-14 Latin-8,ASCII码加盖尔语和威尔式语 ISO-8859-15 Latin-9,Latin-0,西欧 ISO-2022-JP 日语 Shift_JIS 日文版Windows EUC-JP 日文版Unix Big5 中国台湾地区,汉语 GB2312 中国大陆,汉语 KOI6-R 俄罗斯 ISO-2022-KR 韩语 EUC-KR 韩语版Unix ISO-2022-CN 汉语 主要工具使用的字符集(默认) 操作系统(Windows): GB2312 服务器(Tomcat):ISO-8859 浏览器(IE):GB2312 数据库(Mysql):latin1(ISO-8859-1) 开发工具(Eclipse):latin1(ISO-8859-1) 编码的穷举法 System.out.println(new String(testString.getBytes(”ISO-8859-1〃),”gb2312〃)); System.out.println(new String(testString.getBytes(”UTF8〃),”gb2312〃)); System.out.println(new String(testString.getBytes(”GB2312〃),”gb2312〃)); System.out.println(new String(testString.getBytes(”GBK”),”gb2312〃)); System.out.println(new String(testString.getBytes(”BIG5〃),”gb2312〃)); %@ page contentType= 〃 text/html; charset=GB2312〃 %:jsp被编译成为html的过程中提供编码方式让java来“读取”表达式当中的字符串。 meta http-equiv= 〃 Content-Type 〃content= 〃 text/html; charset=gb2312〃:为IE浏览器提供编码选择,是用来” 显示”最后的数据。 1. 编码语句: %@ page language=“java” pageEncoding=“UTF-8”% %@ page contentType=“text/html;charset=

您可能关注的文档

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档