C语言汉字写入问题及Unicode优势.docVIP

下载本文档

1
0
约 10页
2016-12-10 发布于重庆
举报

C语言汉字写入问题及Unicode优势.doc

C语言汉字写入问题及Unicode优势

C语言汉字写入问题及Unicode优势默认分类 2009-06-13 09:22:13 阅读552 评论2 ??字号：大中小?订阅常用的字符编码有以下三种：1、ASCII 只支持英文，全部为8位2、DBCS? 支持英文和中文，但中文需要两个字节（16位）3、UNICODE 支持英文和中文，英文和中文都需要两个字节 ASCII是DOS时代的，无法支持中文。DBCS是Win9x支持的字符集。UNICODE是win2k和xp支持的字符集。而汉字的编码目前有GB2312-1980和GB18030-2000，GB2312就是DBCS类型的汉字编码，GB18030就是UNICODE的汉字编码，当然GB18030兼容GB2312，也就是说GB18030也支持DBCS的字符处理方式。虽然GB18030是2000年后强制执行的国家标准，但目前使用最多的还是GB2312编码，而且GB2312也足够处理你所用到的汉字了。还有GBK编码是GB2312的增强版。这里我仅支持GB2312。由于GB2312是中国大陆制定的标准，所以繁体中文并不在GB2312的编码中，如果你的程序需要支持繁体中文，则还需要处理Big5编码。其实也很简单。下面说一下在C中如何处理GB2312编码的汉字。以VC6.0为例，如果声明变量的类型为wchar_t则是UNICODE编码，如果是char则是DBCS编码比如我

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

C语言汉字写入问题及Unicode优势.docVIP