多语言应用程序的开发.pptVIP

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* 效果(左侧英文,右侧中文) * 相关链接与工具 汉典: Unicode 官方网站: 二进制文件查看器: WinHEX 与 UltraEdit 的(HEX模式) * Thank you! 多语言应用程序的开发 东华大学计算机科学与技术学院 计算机应用系 钟芸龙 2009年11月13日 Development of Multilingual Application * 背景 随着计算机技术的快速发展,软件的交流越来越频繁,软件界面并不仅仅局限于同一种语言 让软件界面支持多种语言已成为软件开发人员不可回避的一个问题 本次 seminar 将介绍开发多语言应用程序时的一些基本概念,工作焦点,相关标准以及解决方案,并演示一个开源的多语言化解决方案GNU Gettext * 基本概念: i18n internationalization 之略,一般译作国际化 将软件与特定语言及地区脱钩的过程 与程序开发人员关系紧密 对一个产品只需做一次 i18n意味着软件有适用于任何地区的“潜力” * 基本概念: l10n localization 之略,一般译作本地化 将软件与特定语言及地区挂钩的过程 与翻译人员联系紧密 需要对特定语言都要做一次,所以有可能不止一次 本地化则是为了更适合于特定地方的使用,而另外增添的特色 * i18n+l10n=? * 答案1 i18n+l10n=g11n, i.e. globalization 两者合起来称为“全球化” 是IBM和微软等商业公司的叫法 * 答案2 i18n+l10n=nls, native language support 两者合起来称为“本地语言支持” 是开源项目的叫法 * 本地化的工作焦点 界面文字(工作量最大的部分) 时间日期、货币和度量衡等 书写排版习惯 更高文化内容层次 前二者可通过下面介绍的gettext来完成,而第三项可通过pango完成,第四项则需要对软件本身进行特定的修改 * 相关语言标准: ISO 639-1 是ISO 639标准的第一部分 使用两位小写字母表示世界上的主要语言 一共规定了136个 示例: 汉语:zh 英语:en 德语:de 法语:fr 日语:ja 俄语:ru 阿拉伯语:ar 葡萄牙语:pt 西班牙语:es 意大利语:it * 相关地区标准:ISO 3166-1 是国际标准ISO 3166的第一部分 为每个国家和地区各分配一个二位大写字母代码、一个三位大写字母代码和一个三位数字代码(联合国统计局建立) 共有244个 二位大写代码示例: 中国大陆: CN 中国台湾:TW 中国香港: HK 中国澳门:MO 新加坡: SG 美国: US 英国: GB 加拿大: CA 澳大利亚: AU * ISO 639-1 与 ISO 3166-1 联合表示 通常用来表示计算机区域设置 ISO 639-1 中的二位小写字母与ISO 3166-1中的二位大写字母中间用下划线连起来 如: 中国大陆的简体中文: zh_CN 中国台湾的繁体中文: zh_TW 中国香港的繁体中文: zh_HK 美国英语: en_US 英国英语: en_GB 另外可加上编码,如zh_CN.GB18030 * 国际字符集标准:Unicode 由Unicode协会制定,Unicode协会的成员包含IBM,微软,苹果,惠普,Adobe和施乐等IT巨头 与ISO/IEC 10646(UCS)互相补充 主要使用的是其BMP部分 BMP=Basic Multilingual Plane 即基本多文种平面,其它罕见的字符则位于辅助平面中 在BMP中的Unicode字符一般表示方法:U+XXXX(XXXX是对应的十六进制表示) Unicode的在计算机中的编码方案称为UTF UTF=Unicode Translation Format 或者 Unicode Tranformation Format * 国际编码标准之一:UTF-16 Unicode 的默认编码标准,通常所说的Unicode编码即是UTF-16编码 根据高位在前或在后的区别,可分为 UTF-16 Big Endian 与 UTF-16 Little Endian 大多数机器使用UTF-16 Little Endian 为了确定Unicode编码的文本文件的字节顺序,可在文件最前面加上两个字节的字节序标记,这个标记称为BOM,BOM = Byte Order Mark 两种字节序对应的BOM如下 Big Endian: 0xFEFF Little Endian : 0xFFFE * 国际编码标准之二:UTF-8 UTF-8是Unicode的一种变长编码标准 比UTF-16使用更广泛 主要由UNIX兼C语言兼著名弈

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档