Unicode字符集的历史与发展1.docx

Unicode字符集的历史与发展 作者 水云青摘要:本文从Unicode入手,介绍由于通信问题而产生的字符集,以及Unicode的发展情况。介绍各种字符集的及其使用。并适时的介绍一些历史情况,主要讨论字符集在java机C语言环境中的使用,及阐述UTF,ISO 8859-1,ASCII他们之间的关系。会介绍一些乱码知识,总而言之,乱码产生的原因就是编码与解码不一致造成的。一、概念:1.BCD码最初的计算机性能和存储容量都比较差,所以普遍采用4位BCD(Binary Coded Decimal)编码(这个编码出现比计算机还早,最早是用在打孔卡上的)。BCD编码简单点说就是将十进制用二进制表示,如下图所示。十进制数8421BCD编码000001000120010300114010050101601107011181000910012.由ASCII码发展到UnicodeBCD编码表示数字还可以,但表示字母或符号就很不好用,需要用多个编码来表示。后来经过演变发展成了ASCII码。ASCII含33(ASCII码范围为:0~31和127)个控制字符, 和95(ASCII码范围32~126)个可显示字符。ASCII编码存储方式:0XXXXXXX其中最高位0,其余七位为0或1,可表示的范围为:0 ~ 2^7 = 0 ~ 128C语言实现打印字符A# include stdio.hint main()

文档评论(0)

1亿VIP精品文档

相关文档