中文编码规则一网打尽.pdfVIP

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文编码规则一网打尽

Unicode 字符编码规范字符编码规范 字符编码规范字符编码规范 网络技术网络技术 gz818 12 月月 27th. 2007, 3:23pm 网络技术网络技术 月月 Unicode 字符编码规范字符编码规范 字符编码规范字符编码规范 Unicode 是一种字符编码规范是一种字符编码规范 。。 是一种字符编码规范是一种字符编码规范 。。 先从先从ASCII 说起说起。。ASCII 是用来表示英文字符的一种编码规范是用来表示英文字符的一种编码规范,每个,每个ASCII 字符占用字符占用1 个个 先从先从 说起说起。。 是用来表示英文字符的一种编码规范是用来表示英文字符的一种编码规范,,每个每个 字符占用字符占用 个个 字节字节 ((8bits )) 字节字节 (( )) 因此因此,,ASCII 编码可以表示的最大字符数是编码可以表示的最大字符数是256,其实英文字符并没有那么多,其实英文字符并没有那么多,一般只用前,一般只用前 因此因此,, 编码可以表示的最大字符数是编码可以表示的最大字符数是 ,,其实英文字符并没有那么多其实英文字符并没有那么多,,一般只用前一般只用前 128 个(个 (最高位为最高位为0 ),),其中包括了控制字符其中包括了控制字符、数字、数字、大小写字母和其他一些符号、大小写字母和其他一些符号 个个 ((最高位为最高位为 ),),其中包括了控制字符其中包括了控制字符、、数字数字、、大小写字母和其他一些符号大小写字母和其他一些符号 。。 。。 而最高位为而最高位为1 的另的另128 个字符被成为个字符被成为 “扩展“扩展ASCII ”,”,一般用来存放英文的制表符一般用来存放英文的制表符、部分音、部分音 而最高位为而最高位为 的另的另 个字符被成为个字符被成为 ““扩展扩展 ””,,一般用来存放英文的制表符一般用来存放英文的制表符、、部分音部分音 标字符等等的一些其他符号标字符等等的一些其他符号 标字符等等的一些其他符号标字符等等的一些其他符号 这种字符编码规范显然用来处理英文没有什么问题这种字符编码规范显然用来处理英文没有什么问题 这种字符编码规范显然用来处理英文没有什么问题这种字符编码规范显然用来处理英文没有什么问题 。(。(实际上也可以用来处理法文实际上也可以用来处理法文、德文等一些其他的西欧字符、德文等一些其他的西欧字符,但是不能和英文通用,但是不能和英文通用),),但但 。(。(实际上也可以用来处理法文实际上也可以用来处理法文、、德文等一些其他的西欧字符德文等一些其他的西欧字符,,但是不能和英文通用但是不能和英文通用),),但但 是面对中文是面对中文、阿拉伯文之类复杂的文字、阿拉伯文之类复杂的文字,,255 个字符显然不够用个字符显然不够用 是面对中文是面对中文、、阿拉伯文之类复杂的文字阿拉伯文之类复杂的文字,, 个字符显然不够用个字符显然不够用 于是于是,各个国家纷纷制定了自己的文字编码规范,各个国家纷纷制定了自己的文字编码规范,其中中文的文字编码规范叫做,其中中文的文字编码规范叫做 于是于是,,各个国家纷纷制定了自己的文字编码规范各个国家纷纷制定了自己的文字编码规范,,其中中文的文字编码规范叫做其中中文的文字编码规范叫做 ““GB2312-80”,”,它是和它是和ASCII 兼容的一种编码规范兼容的一种编码规范,其实就是利用扩展,其实就是利用扩展ASCII 没有真正标没有真正标 ““ ””,,它是和它是和 兼容的一种编码规范兼容的一种编码规范,,其实就是利用扩展其实就是利用扩展 没有真正标没有真正标 准化这一点准化这一点,把一个中文字符用两个扩展,把一个中文字符用两个扩展ASCII 字符来表示字符来表示。。 准化这一点准化这一点,,把一个中文字符用两个扩展把一个中文字符用两个扩展 字字符来表示符来表示。。 但但 是这个方法有问题是这个方法有问题,最大的问题就是,最大的问题就是,中文文字没有真正属于自己的编码,中文文字没有真正属于自己的编码,因为扩展,因为扩展 但但 是这个方法有问题是这个方法有问题,,最大的问题就是最大的问题就是,,中文文字没有真正属于自己的编码中文文字没有真正属于自己的编码,,因为扩展因为扩展 ASCII 码虽然没有真正的标准化码虽然没有真正的标准化,但是,但是PC 里的里的ASCII 码还是有一个事码还是有一个事 实

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档