C语言汉字写入问题及Unicode优势.docVIP

  • 1
  • 0
  • 约 10页
  • 2016-12-10 发布于重庆
  • 举报
C语言汉字写入问题及Unicode优势

C语言汉字写入问题及Unicode优势 默认分类 2009-06-13 09:22:13 阅读552 评论2 ??字号:大中小?订阅 常用的字符编码有以下三种: 1、ASCII 只支持英文,全部为8位 2、DBCS? 支持英文和中文,但中文需要两个字节(16位) 3、UNICODE 支持英文和中文,英文和中文都需要两个字节 ASCII是DOS时代的,无法支持中文。DBCS是Win9x支持的字符集。UNICODE是win2k和xp支持的字符集。 而汉字的编码目前有GB2312-1980和GB18030-2000,GB2312就是DBCS类型的汉字编码,GB18030就是UNICODE的汉字编码,当然GB18030兼容GB2312,也就是说GB18030也支持DBCS的字符处理方式。虽然GB18030是2000年后强制执行的国家标准,但目前使用最多的还是GB2312编码,而且GB2312也足够处理你所用到的汉字了。还有GBK编码是GB2312的增强版。 这里我仅支持GB2312。由于GB2312是中国大陆制定的标准,所以繁体中文并不在GB2312的编码中,如果你的程序需要支持繁体中文,则还需要处理Big5编码。其实也很简单。 下面说一下在C中如何处理GB2312编码的汉字。以VC6.0为例,如果声明变量的类型为wchar_t则是UNICODE编码,如果是char则是DBCS编码比如我

文档评论(0)

1亿VIP精品文档

相关文档