附录3中文字码处理说明.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
附录3中文字码处理说明.doc

附錄:中文字碼處理公文以電子方式傳遞時,若需經公文電子交換中心,則交換之公文需轉換為中文標準交換碼CNS11643以下簡稱國標碼。國標碼 機關(構)應有中文字碼管理人員管理、維護各機關構內共用之使用者造字區字集與前置處理軟體建置之單位自用造字對照檔之正確性,並可視需要應用國標碼全字庫網站.tw)提供之機制。 公文管理系統收文、發文之傳遞交換中,均需整合搭配以下功能,以使相關作業順利: 處理BIG5、BIG5E、、國標碼。 具備國標碼對照檔簡稱CNS_B5.tbl與BIG5、國標碼對照檔簡稱CNS_B5E.tbl與BIG5E、國標碼對照檔簡稱CNS_UCS.tbl與,供轉碼程式使用。 依據用戶端之各機關構內共用之使用者造字區字集建置「自用(造)字碼與國標碼對照表」檔以下簡稱單位自用造字對照檔或CNS_B5U.tbl,供轉碼程式使用。 收文端接收之XML格式公文,若經轉碼,收文機關構之CNS_B5U.tbl沒有對照之字碼時,應通知機關內部中文字碼管理人員於CNS_B5U.tbl中新增自用造字,提供機關構內使用者使用,以確保收文端之電子檔能正確表達發文端所發公文之中文字形。 國標碼轉碼原則,相關規範說明如下: 檔案檔頭需以?xml version=1.0 encoding= ?開頭。 以 UTF-8 編碼的檔案:整份文件需以UTF-8編碼,其檔案檔頭必須是?xml version=1.0 encoding=UTF-8?開頭。 以 BIG5編碼的檔案:整份文件需以BIG5 編碼,其檔案檔頭必須是?xml version=1.0 encoding=BIG5?開頭。 以 CNS11643編碼的檔案:整份文件需以CNS11643 編碼,其檔案檔頭必須是?xml version=1.0 encoding=CNS11643?開頭。 檔案檔頭前個Byte必須為: 0x3C 0x3F 0x78 0x6D 0x6C。 檔案檔頭不可有BOMByte-order mark)識別字元,例如 0xEF 0xBB 0xBF 這個位元等。 檔案檔頭不可有 ISSO 2022 控制符,例如 SI0x0f)等。 CNS11643編碼規範: 字集編碼需根據:ISO-2022-CN、ISO-2022-CN-EXT 標準ISO 2022-CN屬於7-bit編碼,將ASCII指定給G0字面、中文字指定給G1或G2字面。 如果前後個字元同屬一個字面時(ASCII也看做一個字面),後字元可維持與前字元相同的編碼格式(ASCII為單位元組、CSIC為雙位元組)。 如果前後2字元分屬不同字面時,就必須在後字元的前面(即2字元之間)插入調用控制符甚或逸出順序控制符以切換字面。 字面的指定與切換需用ESC sequence)加上調用控制符。 第 0、1、2字面ESC sequence)可省略,只用調用控制符,因啟動中文系統時,一併將ASCII和CSIC的第1、第2字面分別載入G0、G1與G2字面,預設 G0字面是 ASCII字面,G1是第一字面,G2是第二字面。 第 3 ~ 80字面,先將ESC sequence)載入G3,再用調用控制符LS3。 字面切換規範: 切換至 ASCII字面,使用調用控制符SI字元碼為0Fh 當後字元為ASCII已載入G0而前字元不是ASCII時,兩者之間必須插入 調用控制符SI字元碼為0Fh。 切換至第一字面,使調用控制符SO字元碼為0Eh 若後字元屬於CSIC第1字面已載入G1而前字元不是,則兩者之間必須插入調用控制符SO字元碼為0Eh。 切換至第二字面,使用調用控制符LS2字元碼為1Bh 6Eh: 當後字元屬於CSIC第2字面已載入G2而前字元屬於其字面時,兩者之間應插入 調用控制符LS2字元碼為1Bh 6Eh。 切換至第3 - 16字面,是使用調用控制符LS3字元碼為1Bh 6Fh: 若後字元屬於第3至第16字面,則兩者之間應先依據該字元所屬字面插入逸出順序“1Bh 24h 2Bh [F]”,再插入調用控制符LS3字元碼為1Bh 6Fh。 切換至第17- 80字面以後的字面,是使用調用控制符LS3字元碼為1Bh 6Fh:若後字元屬於第17至第80字面,則兩者之間應先依據該字元所屬字面插入逸出順序“1Bh 24h 2Bh [I] [F]”,再插入調用控制符LS3字元碼為1Bh 6Fh。 調用控制符列表 調用控制符 SI (Shift In) 0F SO (Shift Out) 0E LS2 (Locking Shift 2) 1B 6E LS3 (Locking Shift 3) 1B 6F 字元集庫、逸出順序與調用控制符關係列表 字元集庫 逸出順序 ( ESC Sequence) 是否省略 逸出順序(ESC sequenc

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档