- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
很久很久以前,有一群人,他8个可以8个字。 再后来,他计算机。 256(2的8次方) 他0开始的32种状态分别规定了特殊的用途,一但终端、打印机遇上约定好的这些字节被传过来时,就要做一些约定的动作。遇上00x10, 终端就换行,遇上0x07, 终端就向人们嘟嘟叫,例好遇上0x1b, 打印机就打印反白的字,或者。他0x20以下的字控制。? 他127号, ANSI 的AsciiAmerican Standard Code for Information Interchange,美国信息互ASCII方案来保存英文文字。 后来,就像建造巴比ASCII里没有的,127号之后的空位来表示255。从128到255扩展字符集。从此之后,? 等中国人6000多个常用127号之后的奇异符号, 规定:一个小于127的字符的意127的字符0xA1用到0xF7,后面一个字0xA1到0xFE,7000多个 ASCII 里本来就有的数字、的全角字符,而原来在127号以下的那些就叫半角字符了。? 中国人民看到 GB2312。GB2312 是 ASCII 的中文 但是中国的 GB2312 没有用到的 后来127号之后的内127就固定表示始,不管后面跟的是不是 GBK 标准,GBK 包括了 GB2312 的所有内容,同20000个新的? 后来少数民族也要用GBK 扩成了 GB18030。从此之后,中 中国的程序 DBCS(Double Byte Charecter Set 双字DBCS系列127的,那? 一个...... 因 DBCS 编码方案,如日本的shift-JIS等),结果互相之间谁也不懂谁的编码,谁也不支持别人的编码,连大陆和台湾这样只相隔了150海里,使用着同一 DBCS 编码方案。当时的中国人想让电脑显示汉字,就必须装上一个汉字系统, BIG5 编码的什么倚天才可以用,装 真是 正在 ISO (国Universal Multiple-Octet Coded Character Set, UCS, 俗称 UNICODE。 UNICODE ISO 就直接16位来ascii里的那些半角字符,UNICODE 包持其原8位16位,而其他文化和半角英文符号只需要用到低8位,所以其高8位永0,因此? 这时候,从旧社会里走过来的程序员开始发现一个奇怪的现象:他们的strlen函数靠不住了,一个 UNICODE 开始,无论是半角的英文字母,还是全角的汉字,它们都是统一的一个字符!同两个字,字符和字两个字是一个8位的物理存元,而字符UNICODE 中,一个字符就是两个字 从前多UNICODE 对于他们来说是一个很好的一揽子解决方案,于是从 Windows NT 开始,MS 趁机把它 UNICODE 方式工作的版本,从WINDOWS 系? 但是,UNICODE 在制 GBK 与UNICODE 在UNICODE编码和另一种编码进行转换,这种转换必须通过查表来进行。 如前所述,UNICODE 是用两个字65535不同的字符,。如果ISO已UCS-4方案,21亿个不同的字符出来(最高位有其他用途),这大概可以用到银河联邦成立那一天吧!? UNICODE 来到UNICODE 如何在网 UTF(UCS Transfer Format)UTF8就是8个位UTF16就是16个位,只不UNICODE到UTF 受到PC机采用的 INTEL 架构,而另一些是采用高位先FEFF,反之,FFFE。不信你可以用二UTF-X格式的文件,看看? 讲到这里,我们再顺便说说一个很著名的奇怪现象:当你在 windows 的联通两个字之后,保存, 其GB2312编码与UTF8编码产生了编码冲撞的原因。 从网上引来一段从UNICODE到UTF8的转换规则: Unicode UTF-8? 0000 - 007F 0xxxxxxx 0080 - 07FF 110xxxxx 10xxxxxx 0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx 例如字的Unicode6C49。6C49在0800-FFFF之间,所以要用3字1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二0110 1100 0100 1001,将0110 110001 001001,依次代替模板中的x,得到:1110-0110 10-110001 10-001001,即E6 B1 89,UTF8的? 而当你新建一个文本文件ANSI, 如果你在ANSI的GB系列的联通的内 c1 1100 0001 aa 1010 1010 cd
您可能关注的文档
- 史上最全的电脑DIY基本知识菜鸟综合总.doc
- 使用 Windows XP 安装程序中的磁盘分区和格式化工具:.doc
- 使用Disk Genius备份硬盘分区表.doc
- 使用DM分区、低级格式化介绍.doc
- 使用ghost软件进行硬盘对拷,对刻的图文攻略.doc
- 使用Nero Burning ROM 7刻录DVD数据光盘.doc
- 使用Nero Burning ROM 将APE(CUE)刻录成CD音乐光盘.doc
- 使用Nero Burning ROM刻录CD音乐光盘.doc
- 使用Nero Burning Rom刻录DVD 数据+视频两用光盘.doc
- 使用Nero Burning ROM刻录DVD镜像文件.doc
文档评论(0)