维哈柯文显示及排版技术的研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
维哈柯文显示及排版技术的研究

维哈柯文显示及排版技术的研究   摘要:在介绍新疆自治区的维吾尔、哈萨克和柯尔克孜文(维哈柯文)特点的基础上,提出了维哈柯文显示及排版应达到的目标。提出了维哈柯文显示及排版的模型,并对模型的关键处理――字符自动选形、按音节断行和字符自动拉长等主要技术作了详细论述。通过对比测试,此模型能使维哈柯文的显示及排版美观规整。同时这些技术已经应用到相关项目中,对维哈柯文软件的开发有普遍的参考意义。   关键词:维哈柯文; 显示及排版; 字母选形; 文本断行; 字母拉长   中图分类号:TP311文献标志码:A   文章编号:1001-3695(2008)03-0836-03      新疆维吾尔自治区总人口约2 000万。其中维吾尔族、哈萨克族和柯尔克孜族约占总人口的60%,所以维哈柯文无论在政府办公,还是在人民日常生活中都有着广泛应用。因此进行维哈柯文信息化技术的研究,对促进新疆的经济发展、提升信息化水平,提高各民族的教育科学文化素质等都具有重要意义。针对维哈柯文文字特点与信息处理的应用需求,基于《信息交换用维吾尔文、哈萨克文、柯尔克孜文编码字符集、基本集与扩展集》和《信息交换用维吾尔文、哈萨克文、柯尔克孜文字体字形》等少数民族信息标准,本文研究了维哈柯文信息处理的关键技术――维哈柯文的显示及排版技术。它们是维哈柯文信息化过程中的难点和关键点。      1维文特点及排版目标      维哈柯文属阿尔泰语系突厥语族,是使用阿拉伯字母的拼音字母文字,所以维哈柯文具有很多类似阿拉伯文的特点,如从右向左书写、靠右对齐、字母自动选形、字母自动拉长等。但维哈柯文和阿拉伯文又有着很大的不同,如某些维哈柯文字母需要用两个阿拉伯字母的组合来表示,字母的选形规则、字母的拉长规则、字母的选形方法都不一样。另外,维哈柯文还具有可按音节断行的特性等。   1)字母自动选形维哈柯文每个字母对应两个、四个或八个字形字母,这些字形字母被称做显现形式。非字形字母被称做名义形式。维哈柯文的字母以名义形式进行输入、存储、逻辑处理、交换和传输,以显现形式进行显示和打印。   维哈柯文中有一种特殊的显示字符形式――复合字。它是在两个特定的显现字符同时相邻出现时,用一个显现字符来替换掉这两个特定的显现字符,该替换字符就被称做复合字。复合字没有对应的名义字符。维哈柯文中共有四对显现字符的组合可以产生复合字,对应的也只有四个复合字。   维哈柯文在显示时,需要将字母的名义形式转换为合适的显现形式,这一过程称为字母选形。字母选形有一定的规则,除了要根据相关规则确定一个名义字母的显现字形外,还要考虑复合字的变形显示。   2)按音节断行当文本过长,一行书写不下时,剩余的文本要能够接着在下一行从右向左书写。文本从一行切换到下一行的过程称为文本断行。断行分为按词断行和按音节断行,它们是两种不同的断行规则。维哈柯文可以按音节断行显示。   3)字母拉长文本断行后,为了美观性和规整性的考虑,根据维哈柯文的相关规则需要拉长某些字母。拉长的方法是在被拉长的字母之前或之后插入拉长字符“\u0640”。   维哈柯文的词是由一个或多个字母组成。这些字母前后相连形成一个或几个连体字母段。在连体字母段中,某些显现字形需要拉长,并且所有字母要沿着同一水平线相连,此水平线被称为基线。字母名义形式和显现形式的对应关系如表1所示。      为了符合用户的文化风俗和使用习惯,针对维哈柯文以上特点,维哈柯文的显示和排版至少要达到以下目标:a)从右向左书写,靠右对齐;b)字符能够自动选形和拉长;c)实现维汉英文混合编辑、排版时的正确显示。      2关键技术研究及其实现      维哈柯文处理中,有关维哈柯文的逻辑处理(查找、排序、比较、字符串连接、取子串、索引字符等)均可以依据维哈柯文字母顺序表、相关规则及字符的Unicode编码进行。针对维哈柯文的显示和排版,尤其是混合汉英文字的维哈柯文的显示及排版。   2.1维文的显示及排版   为实现维哈柯文显示及排版目标,本文提出维哈柯汉英文混合显示及排版的模型如图2所示。   图2维哈柯汉英文混合排版模型   模型的核心处理单元为视图部分,该部分实现了维哈柯文的特征处理。简要说明如下:   a)文本方向调整,即将存放在模型中的文本重新排列。重排后的文本经后继处理就是最终要显示的文本。一段文本如果是由维哈柯文与汉英文混合书写的,那么此文本的基本方向就是文本的主要显示方向。例如维文中嵌套汉文,文本的基本方向就是从右向左;反之如果汉文中嵌套维文,文本的基本方向就是从左向右。文本重排将基于基本方向,根据字符的方向属性划分文本的run(run是具有相同方向的连续字符的最大集合)和嵌套层次;然后在BIDI算法中解析run和

文档评论(0)

151****1926 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档