关于UTF-8到GBK的转换.doc

  1. 1、本文档共100页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于UTF-8到GBK的转换

码制转换:UTF-8到GBK 在一个项目中,我负责了设计打印信息的结构并将其转成打印机识别的16进制,刚开始我在Java工程中进行我的工作,一切都很顺利,很早便交工,老大也很满意。当项目进行整合的时候,我的代码被移植到了android的工程中,出现乱码的错误。老大和我说,打印机识别的是GBK码对应的16进制,PC机上的String默认编码是就是GBK,但是android默认的却是UTF-8。 下午六点有人来看这个项目,老大一点半找我过去,问我能不能赶在六点之前解决这个问题,我拍拍胸脯说没问题,因为我在想Java的类库那么强大,转码这个小问题不是很容易就解决了嘛。 一直在尝试着各种函数String ans = new String(obj.getBytes(“UTF-8”),”GBK”),好像还尝试过转换成一种中间码制,就是不肯放弃,等参观的人都走了还没整出来,呵呵,真他妈丢人。 最后老大给了我一个文档,是用C写的,现将UTF-8转成Unicode(它们之间很有规律),在通过码表将Unicode转化成GBK,当时一听就崩溃了,心想,Java的封装性这个好,我干嘛还要按位操作,写的那么繁琐啊,果断抛弃。 黔驴技穷,没办法,只好采用通过Unicode和码表进行转换了。 获得Unicode的代码: static int [] getUnicode(byte []bytes) { int [] inf = new int[bytes.length]; int index = 0; String b1 = ,b2 = ; int bytes_length = bytes.length; for (int i = 0; i bytes_length; i++) { Integer int_byte = (int) bytes[i]; String binaryString = Integer.toBinaryString(int_byte); switch(i){ case 0: b1 = binaryString.substring(28, 32); break; case 1: b1 += binaryString.substring(26, 30); b2 = binaryString.substring(30,32); break; case 2: b2 += binaryString.substring(26, 32); break; } } String temp = b1 + b2; char [] ss = temp.toCharArray(); int sum = 0; for(int k = 1;k = ss.length;k++) { if(ss[k-1] == 1) { sum = sum * 2 + 1; } else { sum = sum * 2 + 0; } if(k % 16 == 0) { inf[index++] = sum; sum = 0; } } inf[index++] = sum; return inf; } 通过文件读取将码表读到文件中,也可以直接写到代码中,只是Java中好像不能写那么大的数据,将其排好序,然后用二分法,对其查找。具体代码如下: String unicode2gbk(int unicode) { // 二分法 int Unicode[] = {....}; String GBK[] = {....}; int begin = 0,end = Unicode.length; int mid; while(bgein = end) { mid = (begin+end)/2; if(dateU[mid] == unicode) return GBK[mid]; if( dataU[mid] unicode ) begin = mid + 1; else end = mid - 1; } } Unicode的码表:{164,167,168,176,177,183,215,224,225,232,233,234,236,237,242,243,247,249,250,252,257,275,283,299,324,328,333,363,462,464,466,468,470,472,474,476,593

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档