- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉字的数字编码输入研究
金如集
序言
计算机的发明,由用于科技计算,扩展到办公应用,首先要解决的是文字的输
入问题,拼音文字例如英文,仅26个字母,大小写加符号,扩展ASCII编码足可应对
全部问题。中国汉字数量大﹑结构复杂,解决汉字输入问题,困难要大得多。
我国自上个世纪 70 年代开始进行了全方位的研究,进入九十年代后,汉字能
否输入计算机的问题已得到解决。经几十年努力,已取得了实用化的成果。
每一个汉字都具有音、形、义三种特征信息,可读、可写、具有特定的涵义。
汉字编码最常见的分类法就是按使用的特征信息分为以音编码、以形编码、音形
兼顾三大类,尚未见有以义编码的报道。中国目前在用的输入法主要是﹕以音为主,
例如各种拼音输入法﹔以形为主,例如五笔字形输入法,笔画输入法和手写输入
法。
目前的总体情况是拼音和五笔字形输入法占据了主导地位,其他的例如笔画
输入﹑手写输入也占有一定的市场份额。
五笔字形输入法规则复杂,难学,在常用汉字范围重码率低,适用于专业打字。
拼音输入法﹕会讲普通话的人易学, 非专业人员多用之。
随着计算机的普及,汉字输入者中专业打字员的比例越来越少,中小学生也
都普遍的开始学习汉字编码输入。汉字编码的易学性问题、重码率、输入效率及
与语文教学的关系等问题日益尖锐地显现了出来。
五笔字型以非常复杂的编码规则换来了在 GB2312-80 字符集内较低的重码率;
适应了职业打字的需要,成为它在职业打字时代非常流行的重要原因之一。
虽然五笔字型在市场上取得了巨大的成功,但它存在的问题也不容忽视。首
先,它的编码规则非常复杂,还有很多例外需要记忆,是难学、易忘﹔其次,当
字符集从GB2312-80到GBK和GB18030过渡时,会出现大量的重码,扩展性差,
使其丧失重码率低的优势﹔最后,五笔字型最致命的弱点是规范性差。有人就此
提出了言辞激烈的批评:“五笔字型违反语言文字规范,它对汉字的拆分具有相当
大的随意性,对国民基础文化素质具有不可忽视的负面影响。它对规范的汉字教
育的冲击同其应用范围的扩大成正比”。
104
拼音输入法是根据汉语拼音中的声母和韵母为汉字编码。会说一口流利普通
话的人,学拼音输入法十分容易,只要你能正确读出汉字﹑以拼音方法就可以用音
码打出汉字,无需特别记忆。
其实,说拼音输入法易学,得益于国家大力推广全国通用的普通话,汉语拼音
和普通话是我国基础教育的内容,以政府行为帮助广大群众学习了拼音的编码规
则,小学生一入学就学拼音,为拼音输入打下了基础。
但是,偌大的中国存在着北方话、吴语、湘语、赣语、粤语、客家话、闽语等
多种方言。其语音差距是很大的,中国政府下大力气,在全国推广普通话,几十年
来,成效不是非常明显,许多人仍讲不了普通话,他们根本无法使用拼音输入。
拼音输入法还有先天不足,拼音中有23 个声母、35个韵母和复韵母以及4种
声调,不考虑声调时,它们组合起来能够拼合成字音的仅有417种。在 GB2312-80
字符集中,平均重码达 16 字之多﹔GB13000 标准有 20902 个汉字,重码达 50 字之
多, 重码问题显得十分突出。
著名的语言学家赵元任用同一个音﹝yi﹞和同一个音﹝shi﹞的汉字分别写
过两篇短文﹕
1.﹝yi﹞ 医姨疫
漪姨倚椅,悒悒,疑异疫,宜诣医。医以宜以蚁胰医姨。亿蚁殪,蚁胰溢。
医以亿蚁溢胰医姨,姨疫以医。姨怡怡,以夷衣贻医。医衣夷衣,亦怡怡。噫!
医以蚁胰医姨疫,亦异矣;姨以夷衣贻医,亦益异已矣!
2.﹝shi﹞ 施氏食狮史
石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。
是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。施氏拾是十狮,适
石室。石室湿,施氏使侍拭石室。石室拭,施氏始试食是十狮尸,食时,始识是
狮尸,实十石狮尸。试释是事。
即使请读音十分标准的播音员朗读,听其音,也会莫名其是﹔在紫光输入法
中,读同一个音﹝yi﹞的汉字有319个,而读同一个音﹝shi﹞的汉字有195个,
听音难辨是客观的事实。但看其文,便知清晰涵义,这表明看形比读音更能清晰汉
字的深意,也充分体现了中国几千汉字文化的内涵。使用拼
文档评论(0)