ISO-10646国际编码字符集存在的问题.pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
ISO-10646 国际编码字符集存在的问题 河北大学人文学院 杨宝忠 ISO-10646 国际编码字符集(以下简称“字符集”)的研制,对于汉字的数字 化、国际化具有积极意义;但由于字符集追求收字数量而忽视字形整理,致使字 符集中存在不少问题,如:字际关系未经整理、字源未彻底分离、新旧字形并存、 收字过滥等等,这些问题在一定程度上影响到字符集的科学性、系统性与利用价 B B 值。本文主要就字符集扩展 区(以下简称“扩 ”)所收汉字存在的具体问题 提出一些粗浅看法,不当之处,敬请专家批评指正。 一、字形失真 汉字笔形有限、构成汉字的笔画数有限、构字部件有限、造字方法有限,在 有限的基础上,字符集收字越多,字与字之间的区别率便会越低,区别率降低导 致汉字错认、错写与错造。字符集基本集(以下简称“基本集”)中已有造错的 字,如:基本集有“溊(6E8A )”字,此字未见传世字书,当是“ ”字误造(利 bo [ ] 用拼音输入法输入 便会检索出“溊”字)。《汉语大字典以下简称《大字典》·水 部》据《正字通》收“ ”字,同“波”,乃篆书“波”字楷定之异者(扩 B 收 录“ ”[23D2B],造成正误字形重出)。扩 B 收字多达四万二千七百多个,其 中大部分已属俗讹字,这些“废字”是否有必要进入字符集,本文姑且不论,下 面举几个扩 B 造错的字。 1、 200C4 此字传世字书未见,当是“ ”字误造(字符集未收“ ”字)。《大字典·厂 部》:“ ,同‘愈’。《字汇补·丿部》:‘ ,音义同愈。’”“ ”为“ ”字俗 讹,《字汇补》、《大字典》谓“ ”同“愈”,非是(说详拙著《疑难字考释与研 究》上编“ ”字条,P17 )。 2 、 293B7 《篇海》卷十四《韋部》引《川篇》:“ ,音亦,皮也。”《新修玉篇》卷二 十六《韋部》引《类篇》字作“ ”,音义同“ ”。《大字典》据《篇海》收“ ” 字(《康熙字典·韋部补遗》同。《字海》收之,右上从夕),张涌泉先生谓“ ” P1132 字当是“ ”字俗书(《汉语俗字丛考》, ),所言是也(“ ”字见今本《玉 篇》,有音无义,恐亦俗讹字)。“ ”字右旁乃“亦”字草书楷化之异者,扩 B 有“ ”无“ ”,“ ”当是“ ”字误为回改。 3、 29886 《大字典·馬部》五画内据《龙龛》收录“ ”字(《龙龛》卷二《馬部》 字同),乃“騁”字俗讹。扩B 有“ ”无“ ”,“ ”盖“ ”字误造。又:“ ” B 29885 29887 字五画,扩 列“ ( )”“ ( )”二字(皆四画)之间,归位亦有 不妥。 4 、 29909 《篇海》卷七《馬部》七画内引《搜真玉镜》:“ ,音驊。”(《篇海》同部七画 内引《川篇》又收“ ”字,音桃,乃“駣”字俗讹)《大字典》据《篇海》收 入而改从旧字形作“ ”,收于八画内。扩B 收所“ ”字盖“ ”字误造。 5、 2989B 此字《大字典》据《说文》收录,《说文》十篇上《馬部》其字训马疾走, 从馬,匄声,当楷定作“ ”。字或作“騔”,“ ”字右旁所从与“騔”字右下 所从相同。扩 B 有“ ”无“ ”,“ ”当是“ ”字之误,承《大字典》、《康 熙字典》等传世字书而误。 6 、 299CC 此字《大字典》据《篇海》、《字汇补》收录。《篇海》卷七《馬部》十画内 引《搜真玉镜》字作“ ”,音讫,缺义训,其字下从木,不从术。“ ”字十四

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档