- 14
- 0
- 约2.37万字
- 约 13页
- 2018-05-15 发布于河南
- 举报
Java字符编码全解
1. 概述
本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。
在下面的描述中,将以中文两个字为例,经查表可以知道其GB2312编码是d6d0 cec4,Unicode
编码为4e2d 6587,UTF编码就是e4b8ad e69687。注意,这两个字没有iso8859-1编码,但可
以用iso8859-1编码来表示。
2. 编码基本知识
最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编
码,重要的有如下几个。
2.1. iso8859-1
属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母a的编码为0x61=97。
很明显,iso8859-1编码表示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机
最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而且在很多协议上,默认使用
该编码。比如,虽然中文两个字不存在iso8859-1编码,以gb2312编码为例,应该是d6d0 cec4
两个字符,使用iso8859-1编码的时候则将它拆开为4个字节来表示:d6d0cec4(事实上,在进行
存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节e4 b8 ad e6 96 87。
很明显,
您可能关注的文档
最近下载
- 自考15040 新思想 00 导论自考15040.pdf VIP
- 钢结构全套课件ppt.pptx VIP
- 2025年普通高中学业水平选择性考试化学试卷 湖北卷(含答案).pdf VIP
- (高清版)B-T 41261-2022 过程工业报警系统管理.pdf VIP
- 电力工程建设项目管理规范.docx VIP
- 大学学前特殊儿童教育考试真题.docx VIP
- 《2025年[河南]三支一扶考试公共基础知识真题试卷及答案》.docx VIP
- 2026年最新山西入团考试题库及答案.doc VIP
- 高等教育自学考试学前特殊儿童教育试题(含答案) .docx VIP
- 自考 新思想 15040《习概新思想》练习题附答案.pdf VIP
原创力文档

文档评论(0)