基于微引擎流水线的机器翻译系统结构20040106.doc

基于微引擎流水线的机器翻译系统结构20040106.doc

基于微引擎流水线的机器翻译系统结构 刘群 中国科学院计算技术研究所,北京100080 北京大学计算语言学研究所,北京100871 liuqun@ 摘要:本文比较了现有各种多引擎机器翻译方法的优缺点,提出了基于微引擎流水线的机器翻译系统结构,详细介绍了有关的数据结构和算法。这种结构的优点在于在部件层次上实现多种算法的并存,通过对微引擎的增删和流水线结构的调整可以方便地尝试各种机器翻译方法的组合,而不需要修改系统的整体算法。文章最后介绍了这种机器翻译系统结构在面向新闻领域的汉英机器翻译系统中的具体实现,给出了实验数据,并进行了总结。 摘要:多引擎机器翻译 微引擎流水线 引言 由于各种不同的机器翻译方法各有特长,也各有缺点,没有哪一种单一的机器翻译方法能够达到理想的效果,因此采用多引擎的方法,希望各种方法能够互补,以达到总体效果的最优,就成为了一种自然的选择。目前多引擎的机器翻译目前已经被广泛采用,而实践证明这种方法也确实有效。 目前常用的多引擎机器翻译系统主要有三种结果形式,我们称之为并行的结构、串行的结构和混合的结构。 在并行结构的多引擎机器翻译系统中,各个翻译引擎各自独立地对输入的文本进行翻译,并将翻译的结果放到一个统一的数据结构中,最后由一个译文选择模块选择出最好的译文组合。 Frederking[1]提出了一种典型的并行多引擎机器翻译的方法。该方法基本思想描述如下

文档评论(0)

1亿VIP精品文档

相关文档