Java中编码以及Unicode总结.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Java 中编码以及Unicode 总结 1.基本概念  bit 位只能是0 或者1  byte 字节一个字节是8 位,1 byte=8 bits 计算机表示的基本单位  KB,MB,GB,TB,PB 是以1024 与byte 进行换算  进制 用符号进行计数 十进制、二进制、八进制(011)、十六进制(0xFF) 字符文字和符号的总称  字符集 多个字符集合的总称。ASCII 字符集、GB2312 字符集、GBK 字符集、BIG5 字符集、GB18003 字符集、Unicode 字符集  byte 可表示2^8=256 个字符的表示 0 0×00 0000,0000 1 0×01 0000,0001 2 0×01 0000,0010 127 0×7F 0111,1111 -128 0×80 1000,0000 -2 0xFE 1111,1110 -1 0xFF 1111,1111  以补码的形式表示的二进制编码。 -2 的表示,2=0000,0010,反码1111,1101,补码=反码+1 1111,1110 表示的就是1111,1110-1=1111,1101,取反就是0000,0010 也就是2,所以 就是-2 2.字符集和编码 2.1.字符(Character) 字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。 2.2. 字符集(Character Set) 一组抽象字符的集合就是字符集(Character Set)。字符集常常和一种具体的语言文字对 应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符 集。一组有共同特征的字符也可以组成字符集,比如繁体汉字字符集、日文汉字字符集。字 符集的子集也是字符集。 计算机要处理各种字符,就需要将字符和二进制内码对应起来,这种对应关系就是字 符编码(Encoding)。制定编码首先要确定字符集,并将字符集内的字符排序,然后和二进制 数字对应起来。根据字符集内字符的多少,会确定用几个字节来编码。每种编码都限定了一 个明确的字符集合,叫做被编码过的字符集 (Coded Character Set),这是字符集的另外一个 含义。通常所说的字符集大多都是指编码字符集(Coded Character Set)。 2.2.1. ASCII 字符集 ( ,美国信息互换标准代码) ASCII American Standard Code for Information Interchange 是基于罗马字母表的一套电脑编码系统。由美国国家标准局(ANSI)制定。 7 位,可以表示2^7=128 个字符。在计算机的存储单元中,一个ASCII 码值占一个字 节 个二进制位 ,其最高位 用作奇偶校验位。 位编码的字符集只能支持 个字符, (8 ) (b7) 7 128 为了表示更多的欧洲常用字符对 进行了扩展, 扩展字符集使用 位 ( )表示 ASCII ASCII 8 bits 一个字符,共 256 字符。 ASCII 扩展字符集比ASCII 字符集扩充出来的符号包括表格符号、计算符号、希腊字母 和特殊的拉丁符号。 2.2.2. GB2312 字符集 GB2312 又称为GB2312-80 字符集,全称为 《信息交换用汉字编码字符集?基本集》, 由原中国国家标准总局发布,1981年5 月1 日实施。在中国大陆和新加坡获广泛使用。GB2312 收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文

文档评论(0)

676200 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档