863课题网络环境的系统软件核心技术及运行平台成果汇报.ppt

863课题网络环境的系统软件核心技术及运行平台成果汇报.ppt

ZZX_MT系统评测报告 巢文涵 李舟军 北航计算机学院 2008-11 提纲 引言 系统描述 词对齐 模型训练 SMT模型及解码器 实验 结论讨论 1.引言 中英SMT系统中的两个问题 词对齐 (Word Alignment) 重定序 (Reordering) 解决办法 词对齐中引入启发式规则,加入ITG约束 重定序模型中结合ITG和句法知识 两个评测 中-英新闻 英-中科技 2.系统描述 ZZX_MT:一个Log-Linear SMT系统 词对齐模块 模型训练模块 解码器模块 词对齐(1/2) 问题 中-英词序差别大 非一一对应 解决思路 在词对齐搜索过程中引入句法知识(ITG文法) ITG:反向转录文法 (Wu 1997) 词对齐(2/2) 词对齐中引入ITG约束算法 模型训练(1/2) 需要训练的模型 语言模型:SRILM 翻译模型: 重定序模型 问题:数据稀疏 解决办法:利用子块近似预测整个块的方向 如: 模型训练(2/2) 块的提取 翻译信息的提取 重定序信息的提取 解码器(1/3) SMT模型特征 翻译模型: 重定序模型 语言模型 词惩罚 短语惩罚 树的同构模型 计算源句法分析树与解码过程中生成的ITG树的结构相似性 尽量使得:句法树的每个子树能够映射到ITG树中的子树 解码器(2/3) 解码过程 束搜索的CYK 解码过程看作是ITG规则的

文档评论(0)

1亿VIP精品文档

相关文档