蒙古文网络信息技术处理的对策.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蒙古文网络信息技术处理的对策 民族语文》2002年第6期 蒙古文网络信息技术处理的对策 华沙宝 从20世纪80年代开始,我们围绕蒙古语言文字,从不同的需求,不同的角度出发,做了 一 些工作,解决了一些问题.可以说,目前蒙古文信息处理事业初具规模,继续发展有了良好 的基础.然而,随着时代的发展,人们对信息技术的依赖程度在不断地提高,特别是网络技术 正在向社会各个环节渗透,成为传播各民族先进文化的重要方式.无论人们怎样去描述21世 纪的特征,rr技术将成为本世纪的焦点. 现行蒙古文有8个元音字母,27个辅音字母.蒙古文的字母表就是由这些独立的字母构 成的.可是,与其他拼音文字的字母表不同,蒙古文字母表中出现了2对书写形式相同的字母 (它们是读做O和u,6和ti的两对元音字母).在实用环境中,即用蒙古文字母拼写蒙古文单 词时,根据词中所处的位置和与相邻字母搭配等条件,每个字母都有不同的变体.这些变体也 许和字母表中的形式相同,也许不相同.例如,读做n的辅音在词首的形式与其表中的形式一 样,而词中在元音前出现和辅音前出现各有不同的变体.辅音字母g在阳性词和阴性词中有 不同的变体.更为复杂的是,不同的字母又有相同的变体.例如,读做a,e的元音字母词中形 式和读做n的辅音字母在词中辅音字母前的形式相同.拼写蒙古文单词时,有些字母的变体 与另外一些字母的变体发生冲突,即某一个字母的变体恰好是另外两个字母变体的组合.例 如,读做d的辅音字母在词中位置有两种不同的变体,其中一个形式恰好与读做O(或u,6,n) 的元音字母的词中形式加读做n的辅音字母(或读做a,e的元音字母)词中形式的组合.在 有些辅音字母后加元音字母时,它们则变成一体.例如,读做b,P的辅音字母后加元音或者在 h,g辅音后加阴性元音等.除了这些拼写变化特点外,蒙古文字具有从上到下(字母书写走 向)从左到右(文字行书写走向)的竖写特征.行款则是从左到右排列. 2000年2月,经过6年多艰难曲折的过程,蒙古文编码国际标准终于获得了ISO/IEC的 通过.在蒙古文编码国际标准之前,曾经有过十几种不同类型的蒙古文编码系统.其中的3 个系统是我们国内研制的,其余几个是蒙古,德国,日本等国家研制的.除了蒙古国学者研制 的SUDAR蒙古文编码系统外,其他几种都没有以字母作为唯一的编码单位.因此,它们无法 满足在信息处理中经常遇到的排序,检索统计等基本要求.这些基本要求得不到保障,就不可 能顺利完成蒙古文字处理这一基本的步骤.没有字处理,词处理,句处理,篇章处理就无从谈 起.SUDAR系统做到了以字母作为唯一的编码单位,满足了蒙古文排序,检索等基本需求. 蒙古文编码国际标准,包括了属于蒙古文种的全部文字,即包括了传统蒙古文,托忒文,锡 伯文,满文以及三种阿礼嘎礼字母.它以字母作为唯一的编码单位,通过一些变通的手法,达 到了蒙古文字母(不含变体)各自都有码位的目的.这样,从信息交换和资源共享的角度来 58 说,蒙古文编码国际标准给我们提供了前所未有的优越前提.可我认为,蒙古文信息处理技术 的基础条件并没有就此达到理想的境界.由于受到ISO编码原则和具体规定的制约,在蒙古 文编码国际标准里,只对蒙古文的”名义字符”(这可以简单理解为在字母表中出现的那些形 式)编码,没有包括其他众多变体——”变形显现字符”.这就给我们留下了一种遗憾.因为, 蒙古文信息的最终用户界面,应该由蒙古文的显现字符形式出现,而不是单一的名义字符形 式.ISO的编码规定中提到,显现字符可以通过用户之间的协定来解决.根据这个规定,中国 和蒙古国之间商定形成了《蒙古文编码国际标准系统实现的用户协定》.这个协定,包括了蒙 古文编码规则,基本字符集和基本字符名称,变形显现字符集和变形显现字符名称,蒙古文参 考表,蒙古文强制性合体字,蒙古文特有标点符号和控制符的说明等等内容,可它仍然没有确 定变形显现字符的码位.在蒙古文参考表和控制符的说明中,只是确定了名义字符到显现字 符的对应规则.这样一来,到目前为止,蒙古文显现字符不仅没有国际标准码位,连”用户协 定”层面上的统一码位都没有.开发蒙古文系统,可以要求大家都遵守蒙古文编码国际标准, 也可以希望所有的开发者遵守中蒙两国用户协定.可是,我们又能拿什么去做统一制定蒙古 文显现字符码位的约束依据呢?在单机上使用或者在局部环境中使用同一种蒙古文系统,也 许不会有什么问题,但在遍布全球的计算机网络大环境中,没有一个共同遵守的”游戏规则”, 从而产生的麻烦是可想而知的. 从一开始做蒙古文信息处理工作的那天起,蒙古文所具有的文字特征就向我们提出了独 特的技术处理要求.20年前,即1983年,内蒙古科委计算中心和内蒙古大学联合研制的”元 朝秘史检索统计系统”,是蒙古文信息处理工作的处女作.当时,我们还

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档