面向机器翻译汉维词语对齐规范研究.docVIP

面向机器翻译汉维词语对齐规范研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向机器翻译汉维词语对齐规范研究

面向机器翻译汉维词语对齐规范研究   摘要:在汉维双语的语料库中,因为词不能对齐引起了各类翻译问题,所以,需要建立一个高质量的汉维双语的语料库,实现词的对齐。本文通过对汉语和维吾尔语的双语语料库的对齐问题进行了研究。建立大规模的双语的对齐语料库是很有必要的,而且双语对齐能够促进汉语语料库的建立。   关键词:及其翻译;汉维词汇;对齐规范   中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2015)20-0199-03   机器翻译是人们借助计算机技术实现不同语言之间的转换,运用软件将一种语言转换成另一种语言。在对自然语言的处理上需要对机器翻译进行实验。机器翻译能够对各类语言加以转换,同时也对语言的研究有推动的作用。现在,人们进入了全球一体化的时代,机器翻译为人们提供了很多的方便,机器翻译的前景也是比较好的。但是,随着社会的发展,不同语言的资料也越来越多,如果仅仅采用人工翻译,需要耗费大量的时间,采用机器翻译能够节省时间,而且也符合现代化社会发展的要求。   1 汉语和维吾尔语词的对比分析   1.1单纯词的对比   在汉语中,单纯词是由单独的语素构成的,这个语素可以是实词,也可以是虚词。在维吾尔语中,单纯词是没有明确的定义的,其语言的形态变化是非常得丰富的,语法的遍体也是由不同的词干和词尾构成的。通过对汉语和维吾尔语的词对比分析,可以分析出汉语的单纯词是由单个的语素构成的,而维吾尔语的单纯词可以由不同的语素构成。   1.2 派生词的对比   派生词是合成词的主要分支,在汉语和维吾尔语这两种语言中,派生词一般都是通过添加后缀的形式实现的,维吾尔语中的派生词一般都不会采用前缀。在汉语中,派生词运用前缀的形式要多一些,但是也不如后缀多。在维吾尔语中,派生词的主要构词法是添加后缀,其在构词中发挥着关键的作用,比在汉语中发挥的作用要大的多。   1.3 复合词的对比   汉语中的复合词是由不同的语素构成的,其主要有偏正关系、支配关系等。在维吾尔语中,复合词的构成方法类似于汉语中句子的构成方法,要通过对句型的分析才能够构成复合词。   2 面向机器翻译的汉维双语词对齐规范和主要方法   机器翻译是人们运用计算机实现语言之间的转换,面向机器翻译的汉维词语对齐规范符合现在化发展的需要,所以,应该对汉语和维吾尔语研究的基础上,分析两种词汇的结构,分析其在词法和句法方面的不同,才能够实现两种语言的准确地转换。   2.1 词的对齐规范的定义   在汉语和维吾尔语两种语言的转换中,实现句子的对齐,句子中的词汇和词汇之间形成连接,词语的对齐是在两个句子之间能够寻找到词汇的子集,从而能够实现句子互译关系的衔接。   1) 一对一对齐   在原有的语言的基础上,其相应的位置或者在更加得范围中,所有的专业术语可以完全地对等,两种语言能够互译,这样就能够实现所有词汇的对应,这样的对齐叫做一对一对齐。   2) 一对多对齐   这种对齐方式实现了词汇的整体化对齐,是单个词能够对应不同语言的多个词汇,此于此的对应不是一对一对齐,而且也不是没有对齐的方式。   3) 多对多对齐   这种对齐方式指的是在维吾尔语里面有几个词汇能够与汉语中的一个词汇对应,实现词汇的全面地表达,这种对齐方式还是比较少见的。   4) 空对齐   这种对齐方式指的是在汉语里面没有词汇能够与维吾尔语中的词汇对应。   2.2 词对齐规划的方法   1) 语义的对等   将一种语言转化成另一种语言的过程中,原有的语言可以翻译成不同的语言,有很多种翻译方法,这些译文尽管使用的词汇不同,但是都可以表达相同的意思,所以他们在语义上能够实现对齐,只是选择的词汇不同。在翻译的过程中,使用不同的词汇对句子翻译,都可以实现两种语言的对齐。   2) 位置的对应原则   汉语和维吾尔语在翻译的过程中除了要实现语义的对齐之外,而且还要实现为止的对弈,根据上下文的语境来翻译,在翻译的过程中是不能离开语境的,所以应该遵循位置对齐的原则,当不能运用准确的词翻译时,在机器翻译时要运用空对齐。   3) 最小的匹配原则   在这项原则中,应该准确地用词,将那些最准确的词汇实现优先对齐,首先要实现虚词的对齐,然后将两种语言的词组对齐,实现专有名词的对齐,尽量实现一对一的对齐方式。   4) 最大的匹配原则   在汉语和维吾尔语双向翻译的时候,尽量实现双向的对齐,在对词汇连接的过程中,需要对齐的词汇有多少,那么,另一种语言也应该选择多少词汇。为了能够形成一个系统的语义单元,所以,在词汇选取的过程中,可以选择一些连接词,这些词汇具有固定的表达方法,而且还能够形成习惯用语,这些词汇的结构是非常得紧密的,一般都是以复合词或者合成词的形式出现

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档