- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第23卷 第1期 西藏大学学报(自然科学版) Vol_23No.1
2008年 s月 JOURNALOFTIBETUMVERSnY(NaturalScienceEdition) May.2008
基于藏文编码GB的藏文排序方法研究
珠杰 欧珠
(西藏大学工学院 西藏拉萨 85oooo)
摘要:藏文排序在字、词典排序,计算机中藏文的排序等方面有着广泛的应用,文章根据藏文编码国
家标准(GB)的整字编码方案,研究藏文的排序问题。通过藏文结构的线性化处理,提出基于藏文编码国
家标准的基字定位算法和排序算法,并将应用于藏文电子词典的排序 中。
关键词:藏文编码国家标准;藏文排序;排序算法
中图分类号:TP391.12 文献标识码:A 文章编号:1005—5738(2008)01—033—03
1引言 2藏文字排序规则
藏文拼写方式是既有横 向组合又有纵向组合 2.1 一级排序规则
的非线性结构 ,是一种二维的独特的文字构成形 在藏文排序时,总体上需要遵守的排序规则定
式。不少专家对藏文字的字典序性进行过深人的研 为一级排序规则,其基本原则就是藏文编码国家标
究,为藏文在计算机中的处理奠定了良好的理论基 准基本集中的0F40到0F68字符序列,符合传统约
础,并对在计算机中的实现进行过有益的探讨。藏 定藏文字母次序排列规则 ,即基本辅音序 3【],包含
文音节构件 (构造级 l【】)排序顺序圆:基字一)前加 从梵文转写来的基本的几个叠置字符。
字一上加字~下加字一元音字符一)后加字一 2.2 二级排序规则
再后加字 ,遵循了这样的排序顺序 ,符合藏文语法 在藏文一级排序规则 中各个辅音字符为依据,
的排序规则。根据藏文编码国家标准,通过藏文非 建立概念字符羽[(辅音字符)为基础的字符系,这样
线性的结构变成线性化的思想,使其按线性规则进 可以为某个字符系建立二级排序规则。本文依据藏
行比较、排序。 文编码国家标准扩充集 A和扩充集B,为各个字符
表 1—1藏文一级排序规则
字符 丌r 可I v 击 , I
编码 OF40 0F41 0F42 0F43 0F44 0F45 0F46 0F47 0F49 0F4A 0F4B
字杯 聂 司
编码一0F4cI10F4D 0F4E 哂好 0F50 OF51 0F52 0F53 0F54 0F55 oF56
字符 习 矗, 巨 . 衙 罩I.‘
编码 0F57 0F58.’0F59 0F5 0F5B 0F50 OF5D 0F5 0F5F.0F60 OF61
字符一 k 羽
编码 0F62 0F63 0F64 oF65 0F66 0F67—0F68
收稿 日期:2007-08-25
基金项 目:国家发改委资助项 目“汉藏在线翻译多媒体电子词典项目”阶段性成果。基金号:发放投
第一作者简介:珠杰(1973一)男,藏族,西藏日喀则人,西藏大学工学院讲师,主要研究方向为计算机网络。
第二作者简介:欧珠(1964一)男,藏族,西藏 日喀则人,西藏大学工学院教授,主要研究方向为藏文信息处理技术。
一 33—
珠杰,欧珠:基于藏文编码 GB的藏文排序方法研究
系建立二级排序规则。比如字符系为例 ,可
文档评论(0)