- 8
- 0
- 约2.5万字
- 约 7页
- 2017-09-13 发布于北京
- 举报
《现代图书情报技术》版权所有,欢迎下载引用!
请注明引用地址:树转录翻译模型解码优化[J],现代图书情报技术,2013(9):23-29.
总第237期 2013年 第9期
树转录翻译模型解码优化
石崇德 乔晓东 王惠临
(中国科学技术信息研究所 北京 100038)
【摘要】针对树转录翻译模型中的规则二元化和解码算法进行深入研究,通过四分化的二元化转换方法减少词汇
化同步转录规则的中间项目,通过实时判断中间项目有效性的RR-CKY算法来避免冗余项目生成。实验证明,
这两种方法能有效减少解码过程中的中间项目,提高机器翻译解码效率,在一定程度上提高机器翻译效果。
【关键词】机器翻译 树转录翻译模型 句法分析 RR-CKY算法
【分类号】TP391.2
DecodingOptimizationinTreeTransducerbasedTranslationModel
ShiChongde QiaoXiaodong WangHuilin
(InstituteofScientific&TechnicalInformationofChina,Beijing100038,China)
【Abstract】Thispaperproposestwomethodstoimprovetheefficiencyofrulebinarizationanddecodingintreetransducer
basedtranslationmodel.Theauthorsconvertsynchronoustransducerrulestofourkindsofbinaryrulestoreducethetem
poraryitems,andproposeRR-CKYdecodingalgorithm,whichcanavoidpartofredundantitemsalongwithdecoding.
Theexperimentsshowthatthesetwomethodscanreducethenumberoftemporaryitemsandmakedecodingfaster.They
canalsoimprovethequalityofmachinetranslation.
【Keywords】Machinetranslation Treetransducerbasedtranslationmodel Parsing RR-CKYalgorithm
1 引 言
近年来,统计机器翻译的研究重点逐渐从基于短语的翻译模型转向基于句法的翻译模型,研究者设计开发了
[1-5]
多种基于句法的翻译模型 ,基于句法的翻译模型已经成为目前主流的机器翻译模型。
基于句法的翻译模型解码算法大多基于传统的句法分析算法,在翻译过程中由于翻译规则的复杂性,以及语
[3]
言模型嵌入等对解码效率要求比较高,本文基于树转录翻译模型 ,研究翻译解码的优化算法。
2 国内外研究现状
基于句法的统计机器翻译模型中,解码主要涉及树结构的分析,因此大多基于句法分析算法。句法分析相关
[6]
的研究历史悠久,成熟的算法包括Chart算法、GLR算法、CKY算法等 。在早期句法分析中,由于人工编写的句
法规则生成能力过强、句法歧义多,导致实用性不强。
在统计机器翻译中,CKY算法流程简洁明了、易于实现,成为绝大多数翻译解码算法的核心算法。但由于机
收稿日期:2013-06-19
收修改稿日期:2013-07-22
本文系中国科学技术信息研究所重点工作项目“多语言科技信息语义关联网络构建及其应用”(项目编号:ZD2012-3-3)和中国科学
技术信息研究所学科建设项目“自然语言处理”(项目编号:XK2012-6)的研究成果之一。
XIANDAITUSHUQINGBAOJISHU 23
知识组织与知识管理
器翻译涉及到两种语言的规则,规则一般较长,部分包
含词汇化规则,因此首先需要将规则转换为乔姆斯基
范式(ChomskyNo
原创力文档

文档评论(0)