通典旧版造字转码.pdfVIP

  • 1
  • 0
  • 约5.48万字
  • 约 24页
  • 2018-02-28 发布于河南
  • 举报
通典旧版造字转码

《通典》舊版造字轉碼說明 中研院資訊所文獻處理實驗室 2007/12/6 陳建安 製作 一、 《通典》一書通典 使用舊版造字 個,字頻 次,詳 ( .xml) 453 2212 如附件一。這 453個造字中, 292個可轉成 Windows XP能顯示 的字,字頻 1533 次;另外 161個字必須轉成構字式,字頻 679 次。 二、 附件一的造字分析表說明如下: 甲、 編號: Big5造字空間為 6217個,編號由 1 到 6217 。 乙、 造字:舊版造字 丙、 字頻 :造字在「 」文件的出現次數 (txt) .txt 丁、 字頻 :造字在「 」文件的出現次數 (xml) .xml 戊、 :造字的 碼 Big5 Big5 己、 :造字所對應的 碼 Unicode Unicode 庚、 :造字在 的對應字形 WinXP Windows XP 辛、 構字式: Windows XP若無對應字形,則改採用構字式 壬、備註凡例: 1 、錯字:與原書字形不符,用正確的字取代原造字,如編 號 的「馬 」字,原字應為「駵」。 1062 2 、取代:為減少造字數量,經比對原書為同字異構者,採 用正體字取代之,亦便於檢索,如編號 3776 的「  棧」為「木箋」字之異構,故以「木箋」字取代, 不另造字。 、配合修改,手動取代: 字頻低於 字頻,經比對 3 xml txt txt及 xml檔案內容後,發現一部分原舊漢籍造字之前已 被人工修改,所以剩餘未修改的舊漢籍造字也配合修 改。如編號 ,舊漢籍造字字形為「卓 5299 戈」,比對 txt檔及 xml檔後,發現原先在 txt檔使用舊漢籍造字 「卓 戈」者,在 xml 檔中部分已人工修改為「戟」,故配 合修改,將編號 的 「卓 5299 戈」字,手動取代為「戟」。 又如編號 ,舊漢籍造字字形為「缻」字, 檔部 847 xml 份修改成構字式「缶 瓦」,但由於已有 字型,

文档评论(0)

1亿VIP精品文档

相关文档