网站大量收购独家精品文档,联系QQ:2885784924

关於统码(Unicode)汉字编码框架的理论问题.PDF

关於统码(Unicode)汉字编码框架的理论问题.PDF

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关於统码(Unicode)汉字编码框架的理论问题

111 關於統⼀碼 (Unicode) 漢字編碼框架的理論問題                     朱  一 星 〈要約〉 近年,筆者は漢字を記号論的に捉え直す試みのなかで,漢字単位説を打ち立てたが, その考えの根幹に対して有効な反論が現れない限り,デジタル情報交換用漢字の現行 符号化モデルに大きな疑念を生じてもおかしくなかろう。なぜなら,「漢字単位」と 称する抽象概念が,文字の形状に左右される根拠はどこにもないからである。 現行国際漢字符号化モデルは,控えめに言っても「符号であり,字形ではない (Characters, not glyphs)」という基本原則に則っているとは言いがたい。離散型の符 号位置に,非離散型の異形漢字を割り当てる場合の,情報交換の伝達精度を危うくす る危険性は誰もが理解できるにもかかわらず,この基本中の基本は,長いあいだ,議 論の枠外に置き去りにされた模様である。 ユニコードは漢字統合をしたために不具合を生じたと俗に認識されがちだが,とん でもない誤解である。いわゆる「統合」は実質的には「同期」であり,そもそも正し い意味の「同期」を実現したことは一度もないのが事実である。それに先立つ漢字単 位の同期に関する議論は,漢字研究分野で未だ注目されていない。 前世紀と違って,漢字異体字セレクタ(IVS)技術が実装できる21世紀では,信 頼に値する漢字符号化モデルを構築するためのインフラ整備について議論を深化させ るべきだと筆者は主張したい。そのためには,漢字の形状に執着するあまり異体・異 形字をプレーンテキストにまで押し込む愚を指摘できるユニコーダーが,今後増えて いくよう切に望む。 〈キーワード〉 汉字单位 汉字编码 中日韩越统一汉字 源码分离 当我们立足于现代符号理论的原理,共时地、系统地考察汉字,便能推导出“汉字单位”概念 (参见朱一星2013)。同样,我们从汉字单位的观点出发审视国际汉字编码字符集,就会看到两个 突出问题。第一,目前的汉字编码常常将简化字和繁体字,以及其他各种异体字甚至讹误汉字,几 乎都放在同一个层面上来对待。第二,是汉字在不同地区之间呈现出严重的理论值非同步现象。 也就是说,号称“统一”的中日韩越统一汉字编码,在框架结构上并非符合汉字符号理论意义 上的同一性要求。这是因为,汉字单位概念的基本属性之一是其抽象性 ,体现为汉字单位(或理解 为汉字的理论值)不受任何图形性要素的左右。中日韩越统一汉字虽然在一定范围内承认各国各地 区汉字的笔形差异,却仍然未能摆脱汉字图形性要素的影响,决定汉字码位的基本前提,始终受到 112 關於統一碼 Unicode漢字編碼框架的理論問題 字体或字形的摆布。 这样的编码模式如果只是在某个封闭单一的网络空间使用,也许问题还不大。事实上,汉字进 入电子计算机的初期,人们也往往将其作为打字机似的工具用来打印文件。然而数码化文字的革命 性意义却不仅仅是为了把文章印刷得精美绝伦,而是让文字(数码信号)往来于不同规范标准、不 同语言文化背景的用户平台。一方面用于不同的显示要求,同时还需要承受数据检索、且需要经得 起多次利用、更需要用于从前不可想象的巨量高速信息分析取舍。换言之,对于数码信息来说,文 字的图形性特征已降为次要问题,而文字作为电磁信号的唯一性才是首要的问题。比如,对于任何 一位中文阅读者来说,“经济”就等于“經濟”;“图书”无非是“圖書”;“广州”理应是“廣 州”;“横滨”与“橫濱”之间也必须是等值关系。 这,就是汉字符号的一个理所当然的总原则,更是在数码信息时代必须得以体现的基本规格。 一.焦点问题 说实话,指出上述的问题现象其实并不困难,事实上这也是笔者第一次看到的统一码标准文件 时便油然而生的疑问。在统一码诞生前后,这也是信息领域一些具有深谋远虑的信息科学家及一些 工程技术人员努力的方向。可是遗憾的是,实现上述原

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档