汉字的数字编码输入的研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉字的数字编码输入研究 金如集 序言 计算机的发明,由用于科技计算,扩展到办公应用,首先要解决的是文字的输 入问题,拼音文字例如英文,仅26个字母,大小写加符号,扩展ASCII编码足可应对 全部问题。中国汉字数量大﹑结构复杂,解决汉字输入问题,困难要大得多。 我国自上个世纪 70 年代开始进行了全方位的研究,进入九十年代后,汉字能 否输入计算机的问题已得到解决。经几十年努力,已取得了实用化的成果。 每一个汉字都具有音、形、义三种特征信息,可读、可写、具有特定的涵义。 汉字编码最常见的分类法就是按使用的特征信息分为以音编码、以形编码、音形 兼顾三大类,尚未见有以义编码的报道。中国目前在用的输入法主要是﹕以音为主, 例如各种拼音输入法﹔以形为主,例如五笔字形输入法,笔画输入法和手写输入 法。 目前的总体情况是拼音和五笔字形输入法占据了主导地位,其他的例如笔画 输入﹑手写输入也占有一定的市场份额。 五笔字形输入法规则复杂,难学,在常用汉字范围重码率低,适用于专业打字。 拼音输入法﹕会讲普通话的人易学, 非专业人员多用之。 随着计算机的普及,汉字输入者中专业打字员的比例越来越少,中小学生也 都普遍的开始学习汉字编码输入。汉字编码的易学性问题、重码率、输入效率及 与语文教学的关系等问题日益尖锐地显现了出来。 五笔字型以非常复杂的编码规则换来了在 GB2312-80 字符集内较低的重码率; 适应了职业打字的需要,成为它在职业打字时代非常流行的重要原因之一。 虽然五笔字型在市场上取得了巨大的成功,但它存在的问题也不容忽视。首 先,它的编码规则非常复杂,还有很多例外需要记忆,是难学、易忘﹔其次,当 字符集从GB2312-80到GBK和GB18030过渡时,会出现大量的重码,扩展性差, 使其丧失重码率低的优势﹔最后,五笔字型最致命的弱点是规范性差。有人就此 提出了言辞激烈的批评:“五笔字型违反语言文字规范,它对汉字的拆分具有相当 大的随意性,对国民基础文化素质具有不可忽视的负面影响。它对规范的汉字教 育的冲击同其应用范围的扩大成正比”。 104 拼音输入法是根据汉语拼音中的声母和韵母为汉字编码。会说一口流利普通 话的人,学拼音输入法十分容易,只要你能正确读出汉字﹑以拼音方法就可以用音 码打出汉字,无需特别记忆。 其实,说拼音输入法易学,得益于国家大力推广全国通用的普通话,汉语拼音 和普通话是我国基础教育的内容,以政府行为帮助广大群众学习了拼音的编码规 则,小学生一入学就学拼音,为拼音输入打下了基础。 但是,偌大的中国存在着北方话、吴语、湘语、赣语、粤语、客家话、闽语等 多种方言。其语音差距是很大的,中国政府下大力气,在全国推广普通话,几十年 来,成效不是非常明显,许多人仍讲不了普通话,他们根本无法使用拼音输入。 拼音输入法还有先天不足,拼音中有23 个声母、35个韵母和复韵母以及4种 声调,不考虑声调时,它们组合起来能够拼合成字音的仅有417种。在 GB2312-80 字符集中,平均重码达 16 字之多﹔GB13000 标准有 20902 个汉字,重码达 50 字之 多, 重码问题显得十分突出。 著名的语言学家赵元任用同一个音﹝yi﹞和同一个音﹝shi﹞的汉字分别写 过两篇短文﹕ 1.﹝yi﹞ 医姨疫 漪姨倚椅,悒悒,疑异疫,宜诣医。医以宜以蚁胰医姨。亿蚁殪,蚁胰溢。 医以亿蚁溢胰医姨,姨疫以医。姨怡怡,以夷衣贻医。医衣夷衣,亦怡怡。噫! 医以蚁胰医姨疫,亦异矣;姨以夷衣贻医,亦益异已矣! 2.﹝shi﹞ 施氏食狮史 石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。 是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。施氏拾是十狮,适 石室。石室湿,施氏使侍拭石室。石室拭,施氏始试食是十狮尸,食时,始识是 狮尸,实十石狮尸。试释是事。 即使请读音十分标准的播音员朗读,听其音,也会莫名其是﹔在紫光输入法 中,读同一个音﹝yi﹞的汉字有319个,而读同一个音﹝shi﹞的汉字有195个, 听音难辨是客观的事实。但看其文,便知清晰涵义,这表明看形比读音更能清晰汉 字的深意,也充分体现了中国几千汉字文化的内涵。使用拼

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档