- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重码率方案
重码率方案
重码率指标从主观上体现出设计者的设计技能,从客观上却反映出取码规则的优劣性。降低重码率是每一个开发者自始至终追求的目标,也是衡量输入法品质的一项硬指标。以国标6763个一二级简体汉字为标准,优秀的输入法其汉字重码率应控制在5%以内,即全部重码字少于338个。
传统五笔之所以高效,是因为他的重码字仅为250组510个(不足编码汉字总数6763的十分之一)。全拼之所以低效,是因为它的重码字最多。超过6000字以上。全拼用户在输入编码后,汉字并不直接上屏,通常需要用户用数字键选择上屏,因数字键超出热键区之外,且输入时,要加以注视并选择,无法实现真正意义上的盲打,因而输入速度无法提高。
可以说,键盘输入法效率的高低,是与重码率的高低密切相关的。(重码能够控制在总量10%以内的输入法,较难见到,绝大多数输入法,都程度较高地带有数字选字词的色彩,输入字词的时候,不能做到“干净利落”。这也是其他输入法多年来无法取代传统五笔的最根本原因。
现代五笔,以创造最高效的汉字键盘输入法为已任,在解决重码问题上,已获得重大突破,将汉字键盘输入法重码降低到了极低限,仅116组236个重码字,用重码字的严格标准衡量,目前没有任何字母键编码的输入法能够达到这一指标(拨开虚假广告的迷雾,人们终将明白这一点)。
重码率与输入法类型及编码方案关系最为密切。从各种类型输入法重码率结果上来分析,一般可以这样下结论(区位、电报等序号码不在比较之列):
全音码输入法重码率最高。每个汉字都有同音字,也就意味着每个汉字都有重码。可以说此类输入法是“在重码堆里打滚”的输入法。
全形码输入法能够较好地处理重码问题。一般能将重码字控制在800字以内。
形音码与音形码输入法能够更好地处理重码问题。有经验的作者一般能将重码字控制在500字以内。
形音码与音形码孰优孰劣?我们认为:由于音形码有诸多弱点,如陌生的字难输、简码数量达不上高指标、输入方法不够直观等原因(被业内嘲弄为女耕男织、倒行逆施),所以作为重码率方案应首选形音码编案方案。更进一步地说就是“先形后音、形主音辅”的编码方案。现代五笔就是这一方案的实践者。
重码率、字根表规则、码元集三者之间存在着“此长彼消”的关系。要想降低重码率,往往要以牺牲字根表规则或扩大码元集范围作代价,这是许多输入法设计者“忍痛”以至不愿公开重码字的真实原因!
现代五笔坚持“不突破26个标准码元集范围”、“最大限度强化字根表规则”这两个基本原则,在低重码与字根表规则两条设计线上,全面发挥数据库强大的筛选功能,找到了两者之间理想的磨合点(可以说是现代五笔设计思想最亮丽的“闪光”点)。此输入法虽有236个重码字,但其中的常用字极少。实际输入时,运用简码、词组、推字上屏等输入技巧,可以妥善消除重码所带来的负面影响,使输入更流畅。
现实中,极少有输入法将自身的重码字公之与众。重码字让用户了解,有利于在实践中扬长避短,更好地应用。现代五笔率先将自身的重码字公开,让一些缺乏透明度,自栩品质高的输入法望洋兴叹。
________________________________________________________________________________
掩盖重码字的手法
近年来,网上竟然有输入法宣称只有几十个重码字,实在令行家难以置信。当然他们的重码字是不能公布的。因为,一公布就会露马脚。这里有两种典型的情况:
一、输入法作者自定重码字标准
通常情况下,一个输入法作者,怀着成功的愿望,辛辛苦苦完成了全部单字的编码工作。可对单字编码一排序,才发现竟然有千儿八百重码字。这是众多设计者始料所不及的,最终成了输入法设计者的难言之隐(注:编码规则类型一经确定,重码字的大致数量也就“框”定了,减少重码只有在这个“框”内进行,其有效途径是反复调整字根在键盘上的位置或增设字根,然而这种办法是以减弱字根表规则、降低易用性为代价的,且奏效的程度不高)。
痛定思痛,为了将自创输入法推广出去,在谈及重码字数量时,他们采用了灵活的说法。并堂而皇之地认为:有简码的重码字就不再是重码字,理由是这些字可以通过简码来输入。
在这种心态支配下,他们只将没有简码的重码字确定为重码字,如此,情况就大不一样了,原来被认为的600个重码字,现在就只剩下不到200个了。确实,简码字作为重码字的挡箭牌,其掩饰作用非常之大,特别是三级简码,可以掩饰绝大多数重码字。
我们认为:重码字作为输入法品质优劣性的重要指标,应以全码字为定义对象。
二、采用“取头断尾”法来掩盖真实的重码字
何为“取头断尾”法?这里举一例子,假设我的输入法真正的重码字有600个(设为300组),可是我想让用户认为无重码,那好办,只要从构成重
文档评论(0)