- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
目录:
在C/C++中使用Unicode字符串 1
Visual C++ UNICODE编码释疑 6
字符编码简介:ASCII,Unicode,UTF-8,GB2312 12
在C/C++中使用Unicode字符串
摘录自:/archives/492
??KC曾“宣”的效果也不怎
1.ANSI(MBCS)和UNICODE的前世今生
??ANSI是最先采用的字符集,以1Byte表示一个字符,后来为了表示含有音标的字母而产生了变种系列。但是这种字符集最大的问题是,无法表示诸如汉字、日本这样的“大字符”
??于是,当初ANSI的那批人(瞎猜的,出MBCS(MBCS中最常用也最常DBCS)。MBCS利用1Byte表示原有的那些字符,并利用2Bytes或更高来表示大字符,于是乎,就可以解决原先的
??但是,1Byte,而某些2Bytes或更高。程序
??内牛UNICODE字符集。
??题外话:这里我们要感谢Apple、Xerox、Compaq、IBM、Microsoft、Oracle.etc,否Coder也要
??UNICODE字符集中,2Bytes来表示,包括’\0′。统一的规范的结果则是效率的提升。
??更UNICODE可以在原来
??既然1F的swd同学指出来了,那“深入”一点
??事实上,默认的UNICODE指的是UTF-16,并且也存在其他表示字符的UTF
??UTF-8.UTF-8将一些字符1Byte,一些2Bytes,一些3Bytes,而一些甚至可以达到4Bytes。值在0×0080以下的字符1Byte,US使用的字符非常合适。而0×0080到0x07FF之2Bytes,常用于欧洲和中0×0080以上的字符3Bytes,用于4Bytes。但是当存在大量0×0080字符UTF-16高,好ANSI兼容
??UTF-32是另一4Bytes,除了程序内部之MS用的不多。
??ps:对于ANSI和UNICODE的介Windows程序Windows核心Wikipedia上,也有??ANSI:/zh-cn/ASCII??UNICODE:/zh-cn/UNICODE
2.为什么使用UNICODE
??其UNICODE比ANSI好用。
?? 自从Windows2KWin的系UNICODE编写,所有ANSI字符在API转换成UNICODE。所以,如果你一UNICODE,RAM开销。
?? 对于JAVA/.NET等“新”的UNICODE
?? 最重要的是,目前世界上大多数的程序用的字符集都是UNICODE,因UNICODE有利于程序国
?? 但是很不幸,由于某国教育的滞后,教材“受害”。(据IDE从TC改成了VC6,可/墙奸的命运)。
3.如何在C/C++中使用UNICODE
??在C/C++中使用UNICODE,就意味着你可能要抛弃已经非常熟悉的char和ANSI版字符串wchar_t,并且在使用字符串的”前加L。比如
view source
print?
1 wchar_t* sz = LKC is a genuis; ??而且,我UNICODE版的字符串wcscpy/wcscat.etc
?? 对于std的I/O,我wcout代替cout
?? 如果你使用的是M$的VC或者M$的CRT和编译器,那么恭喜你,M$在
?? M$利用TCHAR来替代原有的字符类型,并定义了_TEXT和_T宏用以支持UNICODE字符,二者定
view source
print?
1 #ifndef _UNICODE 2 ??????#define TCHAR?? wchar_t
3 ??????#define _T(x)? L##x 4 ??????#define _TEXT(x)? L##x
5 ????#else 6 ??????#define TCHAR?? char
7 ??????#define _T(x)? x 8 ??????#define _TEXT(x)? x
9 ????#endif ??很显然,利用TCHAR和_T可以很方便的在ANSI和UNICODE之
?? 而M$也CRT字符串_t开头的)。比如_tcscpy在UNICODE下wcscpy,在ANSI下strcpy。
?? 如果你用的不是M$的IDE,其
4.如何在使用UNICODE的console下输出含有中文的字符串
??对于很多人来说,这的确是一个问题。在默认的情况下,包含有中文字符的字符串是无法在console中
?? 根据MSDN的ANSI位置,正是console中UNICODE字符串。所以我们只需要简单的设置下代码页即可。
?? 在main的_tsetlocale(LC_ALL, L”CHS”);即可。
?? 这同样
您可能关注的文档
最近下载
- CFMOTO春风动力450SR S CF400-9(6AQV-380101-3000-11 CN233)摩托车使用手册.pdf
- 甘肃《建筑抗震加固工程消耗量定额》.pdf
- 水电站砂石系统施工组织设计(221页).docx VIP
- 2024新人教版初中英语七年级下册重点知识点归纳(复习必背).pdf VIP
- 《甘肃省建筑维修工程消耗量定额(2025)》.pdf VIP
- 甘肃省市政维修养护工程消耗量定额补充子目基价2023.pdf VIP
- 金元水电站砂石加工系统工程施工组织设计.doc VIP
- 核心素养导向下课堂教学40页课件.ppt VIP
- 现代农业技术手册.doc VIP
- 肺功能操作评分表.xlsx VIP
文档评论(0)