- 2
- 0
- 约 6页
- 2016-10-02 发布于北京
- 举报
融合句法信息的双语词对齐方法研究.doc
融合句法信息的双语词对齐方法研究
摘要:词对齐研究是多文种信息处理工作的一项不容忽略的基础性研究内容。通过针对中文和蒙古文词对齐研究中存在的形态和词序不对称以及支撑词对齐研究的对齐语料缺乏问题,开展融合语言信息的中蒙混合词对齐模型构建方法研究。利用产生式词对齐结果以及中蒙两种语言的语言信息作为潜特征,建立高质量的融合语言信息的中蒙混合词对齐模型。实验结果证明,该文提出方法对于利用可比语料抽取对齐语料是可行的。
关键词:句子对齐;短语翻译;中文短语
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2014)07-1519-05
自然语言信息处理技术的快速发展,加上互联网的广泛应用和硬件性能的高速提升,已经可以对更多的研究任务、更复杂的自然语言以及更大规模的数据进行分析与实践,尤其是为机器翻译(Machine Translation)的发展注入了新的活力。互译语言之间的词对齐(Word Alignment)研究作为机器翻译领域的重要研究内容,具有重要的学术意义和潜在的应用价值,是一项复杂而具有挑战性的工作。首先,对齐概念已经超过一般意义上的词与词之间的对齐关系,而将其研究范畴扩展到词与短语、短语与词以及短语与短语之间的对齐关系的确立问题,研究者认知受限和语言自身动态演变等因素使得其表述工作相当困难。其次,这个课题交叉于传统的语言学与计
原创力文档

文档评论(0)