- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
以音节为输入单位的藏文输入模型研究水
蜘麓 蒲 ·软件研究与探讨
以音节 为输入单位 的藏 文输入模 型研 究 水
王 维 兰
(西北民族大学 中国民族信息技术研究院,甘肃 兰州 730030)
摘 要 :以藏文音节作为输入 的基本单位 ,建立 了音节与词的编码模型 以及音节输入 、词汇输入
和联想输入的模型并实现 了藏文输入方案。试验结果表 明,该方案科学、合理 。输入方法简单、方便、
快速 。
关键词 :藏文输入 编码模 型 输入 系统模型
1问题的提 出
藏文输入是藏文信息处理的一个重要 内容。目前藏 qt1日团吕团固
文输入法主要有基字输入法 、拉丁输入法和区位码输入 团 日萄1q团圉团固
法 ”【。基字输入法类似于拼写输入法 【,国外 的Wylie【输 团 团
入法即为拉丁输入法。基字输入法和拼写输入法都是将 囝 1 藏 文晋 节 结 构
字丁拆分成藏文字母 ,然后规定编码顺序 ,或者按照藏
并分析藏文的特点 ,定义 了5个集合:(1)={t:t是藏文
文书写规则依次输入 。Wylie输入法是键入字丁 的拉丁
音节}是规范藏文音节集 。藏文有严格 的音节拼写规则 ,
转写 ,从而转换为藏文字丁。总之 ,这几种输入法都是
规范音节是本方案必须获得的一个统计数据 ,根据 已经
以藏文字丁为编码单位输入的。根据字丁的叠加层数 ,
统计 的数据 7【18【1,集合 含有 的元素个数约 12000左右。
有不等的击键次数:基字字丁需 2键 ;叠字 (含元音 )字
以此集为基础建立如 下各集 。(2)W={w:w=t.t …..
丁击键次数 比层数少 1;无元音 的3层叠字则需 4键 。
t t ∈T,k=1,2,……m,m为一个词包含 的音节数 ,W
参 考文献[4】实现 了一种藏文词组输入方案 ,其基本特
是词}为藏文词集 。(3)C={c:c是键盘字符}是编码字符
点是按照单音节词 、双音节词 、三音节词 、四音节词和多
集 。C可 以是小写 26个英文字母 、大写英文字母 、10个
音节词分另0以每个词各音节的基字与后置字编码 ,实现
藏文词输入 。本文建立 以音节为基本输入单位的输入模 数字 0~9以及键盘上的其他字符 。(4)S={s:s=C-C2……
C ,其 中 Ck∈C,k=1,2,……n是英 文字母 数 目}是藏 文
型、词汇输入模型及其相应的联想输入 ,从理论和实现
的角度解决藏文 的快速输入 问题 。 数字、符号、音节、梵文代码集 。每个代码 都是一个或
若干编码字符。因为 S是 对应 的编码集 ,而不同音节
2藏文输入法编码方案模型
有相 同的代码现象 ,如对三字音节 :1q 和双字音
2.1以音节为输入单位 的可行性及其编码模型的建立
藏文音节结构的两种形式如图1所示。一个音节有 节:{;I.=:的编码就可能一样,因为前一个音节中的第二
个字母在第二个 音节 中是下加字 (变形 显示 ),所 以 S
7个成分 ,l、2、3、4、5、6、7分另0为基字、上加字、下加
字、前加字 、后加字、又后加字和元音位置 。
文档评论(0)