- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
藏文联想输入法设计
藏文联想输入法设计
摘 要: 藏文输入法是藏文信息处理技术的一项基础工作,藏文输入法包括藏文单字输入法和词语联想输入法。文章在讨论藏文输入法实现方法的基础上,设计了藏文联想输入法中的生成树模块、检索模块和联想模块。
中国论文网 /4/view-7033435.htm
关键词:藏文信息处理 联想输入法 生成树
中图分类号:TP391 文献标识码:A 文章编号:1003-9082(2015)06-0002-01
一、引言
藏文是属于拼写文字,具有纵向和横向组合的特点,一个完整的藏文字由七个部件组成,按书写顺序依次是前加字、上加字、基字、下加字、元音、后加字、又后加字。藏文输入法就是根据用户的输入查找出相应的藏文字供用户选择,它分为两部分,一是运用分析、综合的方法将藏文字排序,也就是字库和码表的生成;二是运用一定的方法将需要的藏文字从字库中取出来,也就是检索,其难点在于检索算法的构造。目前已经开发出来的藏文输入法有方正、华光、桑布扎、班智达等,这些输入法不具有联想功能,从而影响了藏文字输入的速度。本文在讨论藏文输入法实现方法的基础上,设计了藏文联想输入法中的生成树模块、检索模块和联想模块。
二、藏文输入法的实现方法
构造藏文外码到内码的转换通常有两种方法,一是采用数组,二是采用有序树。
1.数组方法
藏文有30个辅音,将第一个字母相同的藏文字定义为一个数组,共有30个数组,分别用unsigned char zw-a[]、unsigned char zw-b[]、……、unsigned char zw-z[]表示。根据用户输入的藏文字在相关的数组中查询,得出相应的藏文字供用户选择。采用数组的方法虽然实现简单,但该方法不易实现藏文的联想功能。
2.有序树方法
静态数组不能动态释放内存,由数据结构算法可知,其检索效率不高,因此有必要将藏文单字构成一棵有序树,动态生成与释放,并且在树中的结点域中不包含藏文字,节省资源。键树是一种特殊的查找树,其树中每个结点不是通常意义的关键字,而是组成关键字中的一个字符,从根到叶子结点的一条“路径”才对应一个关键字。
设字符集{AE,AF,AG,AH,AI,AL,AN,AO,AR,AU,BA,BD,BG,BK,BN,BR,BS},按首字母将其分解得{AE,AES,AEH,AF,AFA,AFD,AFG,AG,AH,AI,AK,AKA,AKD,AKF,AL,AN,AO,AR,AU}和{BA,BD,BG,BGS,BK,BKS,BN,BR,BS}对于关键字个数大于1的集合再按第二个字母进行分解为{{ AF,AFA,AFD,AFG},{ AK,AKA,AKD,AKF }},其它的集合也按类似的方法分解。按此方法分解的集合很容易生成一棵有序树,同一层的兄弟结点之间所含的字符从左至右有序。从根结点到某子结点或叶子结点的一条路径构成一个关键字,对于某结点的子结点来说,它是有序的,即从左至右由小到大排列,这样将有利于构造和检索。
三、藏文联想输入法的设计
藏文输入的关键是根据用户的输入,从给定的字库中检索出相应的藏文字,即由用户的输入得出相应的藏文字的位置信息,根据该信息检索相关藏文字供用户选择,具体实现分为生成树模块、检索模块、联想模块。
1.生成树模块
为了实现该树的自动生成,需要构造一张藏文码表,该表主要包含字母和它对应的藏文字的个数。为了自动地生成有序的树,该表中的字母必须按照以字母从小到大排列,即首先比较第一个字母,第一个字母相同再比较第二个字母,以此类推。生成树模块主要从字母表中读取字母对应的藏文字信息,采用递归的方法自动实现。
2.检索模块
检索模块主要是根据用户的输入在树中查询相应的结点。从根结点出发,沿着与给定值相应的指针逐层向下,若分支结点值和给定的值相等,则停止查找,若不相等,则继续向下查找,直至叶子结点。若叶子结点相应的域值和给定值相等,则查找成功,否则,查找过程失败。当查找成功时,取相应结点包含该字母对应的藏文字的位置和个数信息,因此很容易以这两个信息作为参数从字库中得到字母相同的藏文字。
3.联想模块
联想功能是在用户完成一个藏文输入时,提示相关的藏文字供用户选择。要实现联想功能,需要重新构造一张表,称为联想码表,表中保存用户选择的藏文字在字库中的位置信息和由该藏文字母开头的联想到的藏文字在字库中位置信息。 将一个字母对应在字库中的位置信息称为地址,则联想码表即是用户选择的藏文字母地址和该藏文对应的联想藏文字的地址表,通过这张表,可以自动构造一棵数字键树。
struct node_figure
{short figure;//该结点的关键字,为0-9的数字
sho
您可能关注的文档
- 白内障食补-试试十种“养眼”食物.doc
- 白内障治疗亲历记.doc
- 白城5号杨扦插育苗技术初探.doc
- 白山黑水琴韵扬.doc
- 白小浅的青春乐章.doc
- 白族元素在拆装式家具中的应用与创新.doc
- 白日有时尽 缘何苦登高.doc
- 白水县有机苹果病虫害绿色防控技术应用与统防统治工作中存在的问题及解决措施.doc
- 白菜高产栽培技术分析.doc
- 白色念珠菌检测在龟头炎诊断中的临床应用效果分析.doc
- 2012-2021北京重点校高一(下)期中语文汇编:词类活用.pdf
- 电力市场与经济运行优化:电力市场优化算法_(28).电力市场中的市场力分析.docx
- 医院培训课件:《俯卧位通气的护理》.pptx
- 电力市场与经济运行优化:电力系统能效优化方法_(1).电力市场基础理论.docx
- 电力市场与经济运行优化:电力系统能效优化方法_(9).电力系统运行与能效优化.docx
- 电力市场与经济运行优化:电力系统能效优化方法_(15).电力市场与环境影响分析.docx
- 电力市场与经济运行优化:电力系统优化调度_(1).电力市场基础与原理.docx
- 电力市场与经济运行优化:电力系统优化调度_(14).电力市场改革政策与影响.docx
- 电力市场与经济运行优化:电力系统运行优化_(4).电力系统运行基础.docx
- 2025年航运行业分析.docx
文档评论(0)