- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种智能型数码输入技术研究与设计
一种智能型数码输入技术研究与设计
【摘要】:随着各类PDA 产品及手机的普及, 在手机中使用中文输入法输
入发送中文短消息、中文电话簿等, 以及用手机上网成为越来越多人的选择。受手机体积限制, 在中文输入时就只能依靠拨打手机的数字按键, 因此用数字键简便、高效地输入汉字成为了大众的急需。
【关键词】:智能型;数码输入技术;研究;设计
中图分类号:TP334.2文献标识码: A 文章编号:
引言
由于手持设备的局限性,很适合使用数字编码方案,其也正在被人们运用到各种手持设备上。基于汉字笔形的数字编码方案,是大部分数字编码方案都有的一个特点,而且用户必须掌握拆分笔形的方法才能使用这样的编码方案。智能输入技术是指借助语言自身的规律性来提高输入法性能的技术。最早为了解决同音字引起的重码问题,该技术被拼音输入法所采用,接着又被用来简化用户输入(比如省去韵母,只输入汉字的声母,此时重码率更高了) ,后来又被用于适应不同用户的输入习惯。目前,在拼音输入法中,为实现拼音流到汉字流的转换, 常常使用智能输入技术,从而实现语句级输入。但是,由于受数字键盘的局限性影响,很难实现在手持设备上进行语句级拼音的输入。如果能够很好地结合数码输入技术与智能输入技术,那么在手持设备上,这样的输入法将会有很好的发展前景。
一、智能型的含义
输入法有两个基本目标:(1)减少平均码长,简化用户输入;(2)降低重码字词键选率。但它们往往是相互制约的,对用户的输入进行简化,必然会在一定程度上增加重码率,从而使键选率升高。由于利用语言本身的规律性,智能输入技术把最有可能的字词排列在前面从而提高首字命中率,可以通过建立语言模型,从而表达语言的规律性问题。
二、智能型数码输入技术的“智能型”体现
1.对于所有的重码字词自动输出最佳排序结果
重码字词键选率是衡量这一特性的一个常用标准,键选率越低,相反用户输入就越方便,即首字命中率就越高。这是“智能型”的一个综合表现,也是大部分智能输入法梦寐以求的一个重要目标。
2.具有连续输入的特???
用户不但能够输入词库中的词,还能输入用户自己的特殊短语、词语。对于用户输入的新词,输入法能具有自动记录的功能,再次输入该词时,会更方便。提高首字命中率上,这一特性能发挥了很大的作用,使数码输入法能够具有连续输入的特性,是本文对输入规则改进的初衷。
3.提供了一种灵活的输入方式
由于一些用户的习惯问题,习惯于输入比较完整的输入码,而有的用户则不同。我们知道,只能满足一类用户的需求是不够的,一个智能的输入方案应该能够满足不同类型的用户的需求。为了满足客户的需求,我们尽最大努力使得这项技术具有最高的灵活性。但是,需要注意的是用户需要为这种灵活性也要做出一点观念上的转变,那就是需要顾客多动一下手,在每个字的输入码之间加入分隔符。而这种转变也是通过在使用较低的平均码长时,才能保证一定的首字命中率来进行弥补的。
4.随着用户对这种输入法的使用,能够不断适应该用户
根据用户输入的历史记录来使输入法不断适应该用户。能够对重码字词给出符合该用户的最佳排序,是提高首字命中率特性的最终效果的体现。
三、数码输入编码规则的改进
目前的数码输入法只能输入词库中已存在的字词,但是用户常常需要输入很多词库中没有的词语,如:地名、人名、习惯用法、专有名词、简称、专业词汇、新出现的词汇等等。这些词语的使用变化性很大,因人而异,几乎不可能把它们一一加入到词库中。一种解决办法是采用自定义词库(也称用户词库),但是要求用户自己添加这些词语往往比较麻烦。如果能够自动记录这些词语,那么当用户再次输入相同的词语时,用户会感觉到极为的方便。因为拼音输入法中,几乎每一个字的拼音的组成结构都是由声母和韵母组成的, 通常比较容易做到自动把输入串切分成拼音串。这样如果用户输入了一个词库中没有与之对应的拼音串的词,也能让用户通过选择键来输入一个新词,同时自动的把这个新词添加到自定义词库中。而数字编码方案在需要输入词语的时候,几乎不可能把输入串自动切分成每个字的输入码,因而就不能直接输入每个汉字的编码。一般采用的解决方法是对词语进行专门的编码,使其不需要切分输入串。而相应地,对于词库中没有的词语, 也就无法无法进行输入。本文主要进行了对于输入规则的修改,由词语中的每个单字的输入码组成而不是使用专门的编码,同时在字和字的输入码之间使用分隔符。为了能够更好地利用智能输入技术对数码输入法的输入规则进行改进,需要把它们有机的地结合起来,同时这样对输入法的改进也对其的设计有了更高的要求:(1)用户输入简短的编码时, 大量的重码字词就会产生,这就要求使用智能输入技术对所有重码字词进行有效的排序;(2
文档评论(0)