中软译星2005年863测试技术报告-自然语言处理.DOCVIP

中软译星2005年863测试技术报告-自然语言处理.DOC

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中软译星2005年863测试技术报告-自然语言处理

中软译星翻译质量改进策略 任燕 洪忻 中国软件与技术服务股份有限公司 北京 100081 renyan@ hongxin@ 摘要: 本文总结了译星翻译系统所采用的技术方法,以及译星系统针对一般篇章翻译所采取的一些策略。在技术方法中,介绍了译星系统的语言模型、结构设计、源文分析与译文生成思想。对于翻译策略,提出了基于词组的语言单元分析方法,以及语义结构优先语法结构的处理原则,从而加强了词组和语义在机器翻译中的地位与作用。同时还介绍了如何加强语义分析的具体实施方法。以这些翻译策略为改进原则,译星翻译系统的翻译质量得到了提高。其中,译星汉英系统的篇章翻译忠实度达到了54%,译星英汉系统篇章翻译达到了51%。 关键词:词组、语义结构 Transtar Approaches for Translation Improvement Yan Ren Xin Hong China National Software Service Co.,Ltd No. 55 Xueyuan Nanlu, Haidian, Beijing 100081, China Abstract: This paper summarizes the technical model in Transtar system. It also introduces some improving approaches of Transtar in its general-article translation. In terms of technical model, it introduces Transtar linguistic model, structural design, basic idea on source analysis and target generation. In terms of translation approach, it puts forward the idea of Phrase as Sentence Unit and Semantic Function as Analysis Preference. Therefore, it puts more stresses on phrase and semantics during machine translation. It also gives a brief introduction on how to conduct semantic function analysis. With these new approaches, Transtar has improved its translation performance. Transtar Chinese-English translation accuracy reaches 54%. And Transtar English-Chinese translation reaches 51%. Key words:Phrase, Semantic Function 我国的机器翻译产品是于上个世纪八十年代正式投入市场的。当时推出机器翻译产品的 目的和服务方向主要是为了满足科技类外文资料的大规模翻译的需求,而且当时直至以后相当长的阶段,机器翻译的目标都是以简单句为主,对于真正意义的“自然语言”,并没有做广泛而深入的研究与处理。其语言规则和分析算法的形成是根据一些简单的例句。这种作法使得一些商品化机译系统远远落后于用户的需要。实际上,用户对机译系统的需要包括了人类生活的各个方面的活动,如社会、政治、经济、科技、商务等等。这些方面的语言现象都是极其复杂的,经常出现好几十字甚至上百字的长句,用户希望机器翻译系统能正确地处理这样的长句,因此,我们认为,机器翻译系统的开发者首先要把自己摆在用户的位置上,力争对实际应用中所碰到的各种复杂长句都能给出高质量的翻译。 以面向用户的实际需要,努力提高翻译质量作为基本的出发点,这几年我们在系统开发时从报章、杂志及书籍中搜集了各个方面的资料,建立了有关政治、经济、科技和商务各个方面的开发语料库。在分析这些语料库的基础上,形成了我们的语法、语义、规则框架,在这一过程中,我们尤其注意了框架的易调试性和可扩充性,这使得我们在开发过程中能通过大量调试不断地修正、完善和扩充我们的规则系统。 具体来讲,译星系统的翻译目标,从过去的为科技类翻译服务,转向一般篇章翻译服务,从只处理简单句,向处理复杂句过渡。为此,译星系统在语言翻译质量的改进上,主要做了以下工作: 由于一般篇章涉猎范围几乎无所不包,译星系统大大扩充了其词汇量,新添词汇10余万条,词汇范围涉及科技、政治、历史、军事、文化等等,从而使得译星系

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档