作业2,趴特(逼)福利逼ㄟ斯滴中文化.pptVIP

作业2,趴特(逼)福利逼ㄟ斯滴中文化.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作业2,趴特(逼)福利逼ㄟ斯滴中文化.ppt

作業 2, 趴特 逼 福利逼ㄟ斯滴 中文化 編碼標準 Ref: .tw/web/word.jsp ASCII 8 bits 理論上有 256 種可能 0x00 ~ 0x7F 共 128 種字元 0x00 ~ 0x1F ? control characters 0x20 ~ 0x7F ? printable characters Big5 使用 2 bytes 來存放中文字 理論上有 65536 種可能 實際上為與 ASCII 相容, 只能使用 19782 個 [0x81 ~ 0xFE][0x40~0x7E, 0xA1 ~ 0xFE] 126 * 63 + 94 126 * 157 19782 編碼標準 – Big5 標準字 13502 常用字 你我他的媽 次常用字 朸旯朿鐰飉 特殊符號 441 符號、控制碼 : ! 。∩ ♂ ├ 罕用符號 使用者造字 5809 三段 編碼標準 – Microsoft Windows Codepage 950 編碼標準 – ISO10646 and Unicode 1 Goal 集結全球通用字符集,成一大聯集 UCS Universal multiple-octet coded Character Set 4 bytes encoding 128 Groups 256 Planes each group BMP Basic Multilingual Plane 00 group, 00 plane 65536 encoding space UCS-2 Unicode Why in BMP 若所有字集都在 BMP 中, 就可以只使用 2 bytes, 否則就要用 4 bytes, 不能混用 編碼標準 – ISO10646 and Unicode 2 BMP 編碼標準 – ISO10646 and Unicode 3 UTF: UCS Transformation Format UTF-16 將一個 32-bit ISO10646 字元轉成多個 16-bit Unicode UTF-8 將一個32-bit ISO10646 字元轉成多個 8-bit Unicode 將一個16-bit Unicode 字元轉成多個 8-bit Unicode 中文環境 1 要做到哪些事情 中文訊息 中文顯示 中文輸入 中文列印 中文處理 中文環境 2 中文化方式 直接修改程式 套件以排山倒海之勢而來 國際化 InternationalizatioN I18N Multi-language architecture 程式設計人員按照該架構的機制與準則寫程式, 便可支援各式各樣的語言 Locale LOCALization Environment database 程式根據使用者選擇的 locale 聯繫到不同資料庫, 進而提供該語言的支援 中文區域化 LocalizatioN L10N 在 I18N 的大架構下 加入 “中文支援” 的工作 中文環境 3 locale 地區性語言的資訊 LC_ALL LC_CTYPE 掌管該 locale 中所有字元的處理方式 LC_MESSAGES 掌管程式訊息輸出所用的語言 LC_TIME 時間格式 LC_NUMERIC 數字格式 LC_MONETARY 貨幣格式 LC_COLLATE 字母順序與特殊字元比較 LANG 語言顯示 效力優先性:LC_ALL LC_* LANG 中文環境 4 設定 locale csh/tcsh shell setenv LC_CTYPE zh_TW.Big5 Bourne Shell export LC_CTYPE zh_TW.Big5 /usr/share/locale/ 各國的 locale 資訊 命名規則: 語言_地區名:字元編碼名稱 zh_TW.Big5 zh_CN.GBK 中文環境 5 中文 console Console Login big5con - 類似倚天的中文 Console Ref: .tw/~statue/freebsd/zh-tut/big5con.html % b5c 中文 Terminal Remote Login M$ Windows: putty, pietty, netterm, multi-term, telnet, …etc. X Window: xterm, rxvt, aterm, mterm,…etc. 設定好中文支援,登入後 setenv LC_CTYPE en_US.ISO8859-1 csh/tcsh export LC_CTYPE en_US.ISO8859-1 sh/b

文档评论(0)

ailuojue1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档