- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
台灣中文數字化發展現況及推動措施 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 (CMEX)財團法人中文數位化技術推廣基金會 報告人:魏林梅 2004/2/23 目錄 中文現況 推動組織 中文資訊應用環境 推動措施 中文碼(Code) 字形(Font) 提供點陣字形 24*24 40*40 楷體向量字形 宋體向量字形(預計於本年度完成) 註:教育部成立學者專家小組審查字形。 文字整理 台灣常用字字頻統計 中國時報、聯合報、國小教科書、國小課外閱讀套書等 常用字約8000字、期中3000字一年用不到5次。 中文字排序標準 包含字的排序、讀音(一字多音)、部首、筆畫。 異體字的整理 工作期間約十年。 蒐錄的字約十萬字。 整理工作已完成,目前正在造字。 整理台灣方言用字 台語 客語 術語名詞 目前完成 資訊 通訊 電機、電 子 化學 大氣科學 化工 其它學門的尚在進行中。 推動組織 標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」 為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設ISO10646(Unicode)等技術組。 成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。 中文資訊應用環境功能 提供字文字碼屬性:字碼(CNS11643、BIG-5、BIG-5E、EUC、Unicode 、GBK) 、部首、筆劃、一字多音、輸入法(倉頡、注音) 、聲音、 字義(2002/12)等屬性。 新增中文字碼作業程序 自造字整理及管理機制 各類字碼轉換表及工具 網頁自造字轉換工具 跨平台全字庫文書編輯軟體 中文資訊共通平台 中文資訊應用環境架構圖 全字庫應用工具4.0 CNS11643國標碼全字庫 ISO10646漢字庫網站 轉碼工具 對照表匯入工具 自造字彙整工具 字形轉入工具 網頁自造字轉換工具 自造字網頁 跨平台全字庫文書編輯軟體 ISO10646漢字庫網頁 推動措施 擴增中文字集(如公司行號、化學名、動物學名、宗教用字) 、字形(製作明體與楷體向量字形)、及屬性(讀音、字義、相關詞、簡繁對照等),充實全字庫網站內容。 藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。 提供業界加值全字庫之機制,如字形、輸入法、 語音輸出等。 繼續參與國際漢字編碼會議(IS0/IEC JTC1/SC2/WG2委員會、UNICODE技術委員會),使台灣電腦中文標準與國際標準接軌。 中文相關標準 制定「中文資訊排序屬性標準」。(審查中) 研擬「網域名稱專用繁簡字碼對照表」草案。 依CNS11643字面,制定「中文字集字形國家標準」。(預計於本年度完成)。 研擬基本部件和基本筆形標準。 * * 國際標準,多國共同使用 4 BYTE 漢字70,205字 擴編(18,000字+30,000字) ISO10646 現 況 碼長、字數 中文碼 由Unicode技術委員會負責推動Unicode成國際標準 2 BYTE 26,781字 4 BYTE 48,800字 UNICODE 用於UNIX電腦系統,為戶役政作業所用。 4 BYTE,55,196字 EUC 專供圖書館作業使用,用戶有國家圖書館、各國立大學圖書館等 3 BYTE,53,940字 CCCII 補充BIG5之不足 (1)13,053字+3,954字 (2)自用字區:1,855字 BIG-5E 個人電腦普遍使用之中文內碼 2 BYTE (1)13,051字 (2)自用字區:5,809字 BIG-5 註:本表未納入IBM、 NEC、王安等主機碼。 新增字 .tw/seeker (漢字庫網站) .tw (全字庫網站) Linux 6.2 目前收集字數:76,067字 一般使用者 查詢 機關團體使用者 全字庫應用工具4.0 全字庫應用工具4.0 網頁設計者 網頁自造字轉換工具 大型資訊系統(如戶政、地政) 跨平台文書編輯軟體 中文資訊共通平台 ☆一般使用者 ☆機關內部自造字管理者(之前已自行造字) 全字庫網站 ( .tw) ☆機關內部自造字管理者(未曾自行造字) 自造字分享 ☆機關內部使用者(無自行造字者) ☆機關內部使用者(有自行造字者) 自造字分享 ☆機關內部使用者 ☆機關內部使用者 查詢自造字 個人自造字對照表 目前收集字數:76,067字 自造字 自造字 自造字 自造字彙總工具
文档评论(0)