- 1
- 0
- 约5.48万字
- 约 24页
- 2018-02-28 发布于河南
- 举报
通典旧版造字转码
《通典》舊版造字轉碼說明
中研院資訊所文獻處理實驗室 2007/12/6 陳建安 製作
一、 《通典》一書通典 使用舊版造字 個,字頻 次,詳
( .xml) 453 2212
如附件一。這 453個造字中, 292個可轉成 Windows XP能顯示
的字,字頻 1533 次;另外 161個字必須轉成構字式,字頻 679
次。
二、 附件一的造字分析表說明如下:
甲、 編號: Big5造字空間為 6217個,編號由 1 到 6217 。
乙、 造字:舊版造字
丙、 字頻 :造字在「 」文件的出現次數
(txt) .txt
丁、 字頻 :造字在「 」文件的出現次數
(xml) .xml
戊、 :造字的 碼
Big5 Big5
己、 :造字所對應的 碼
Unicode Unicode
庚、 :造字在 的對應字形
WinXP Windows XP
辛、 構字式: Windows XP若無對應字形,則改採用構字式
壬、備註凡例:
1 、錯字:與原書字形不符,用正確的字取代原造字,如編
號 的「馬 」字,原字應為「駵」。
1062
2 、取代:為減少造字數量,經比對原書為同字異構者,採
用正體字取代之,亦便於檢索,如編號 3776 的「
棧」為「木箋」字之異構,故以「木箋」字取代,
不另造字。
、配合修改,手動取代: 字頻低於 字頻,經比對
3 xml txt
txt及 xml檔案內容後,發現一部分原舊漢籍造字之前已
被人工修改,所以剩餘未修改的舊漢籍造字也配合修
改。如編號 ,舊漢籍造字字形為「卓
5299 戈」,比對
txt檔及 xml檔後,發現原先在 txt檔使用舊漢籍造字 「卓
戈」者,在 xml 檔中部分已人工修改為「戟」,故配
合修改,將編號 的 「卓
5299 戈」字,手動取代為「戟」。
又如編號 ,舊漢籍造字字形為「缻」字, 檔部
847 xml
份修改成構字式「缶 瓦」,但由於已有 字型,
您可能关注的文档
最近下载
- 3 浮力——液面升降问题(原卷版).docx VIP
- 核心素养视域下的初中数学单元作业设计研究.docx VIP
- 纪念红军长征90周年演讲稿(2025年最新版).pptx VIP
- 2002-2012 十年北京卷高考语文试卷深度解析.pdf VIP
- -大单元视域下数学单元作业设计——以“图形的平移与旋转”为例.pptx VIP
- 培智生活语文教案合集.pptx VIP
- 电力系统仿真:电力系统暂态仿真_(2).电力系统基础知识.docx VIP
- ISO TR-20491-2019_钢紧固件氢脆的基本原理 (中文).doc VIP
- 阿特拉斯.科普科-离心空压机说明书AIB 9829300826-01.pdf VIP
- 基于MATLAB的电力系统短路故障分析与仿真.pdf VIP
原创力文档

文档评论(0)