ZZX_MT系统评测报告 巢文涵 李舟军 北航计算机学院 2008-11 提纲 引言 系统描述 词对齐 模型训练 SMT模型及解码器 实验 结论讨论 1.引言 中英SMT系统中的两个问题 词对齐 (Word Alignment) 重定序 (Reordering) 解决办法 词对齐中引入启发式规则,加入ITG约束 重定序模型中结合ITG和句法知识 两个评测 中-英新闻 英-中科技 2.系统描述 ZZX_MT:一个Log-Linear SMT系统 词对齐模块 模型训练模块 解码器模块 词对齐(1/2) 问题 中-英词序差别大 非一一对应 解决思路 在词对齐搜索过程中引入句法知识(ITG文法) ITG:反向转录文法 (Wu 1997) 词对齐(2/2) 词对齐中引入ITG约束算法 模型训练(1/2) 需要训练的模型 语言模型:SRILM 翻译模型: 重定序模型 问题:数据稀疏 解决办法:利用子块近似预测整个块的方向 如: 模型训练(2/2) 块的提取 翻译信息的提取 重定序信息的提取 解码器(1/3) SMT模型特征 翻译模型: 重定序模型 语言模型 词惩罚 短语惩罚 树的同构模型 计算源句法分析树与解码过程中生成的ITG树的结构相似性 尽量使得:句法树的每个子树能够映射到ITG树中的子树 解码器(2/3) 解码过程 束搜索的CYK 解码过程看作是ITG规则的
您可能关注的文档
最近下载
- 国家开放大学 学前教育专业《儿童家庭教育指导》阶段性学习测验2答案.pdf VIP
- 2025-2026学年广东省深圳市宝安中学(集团)初中部九年级(下)开学数学试卷(含答案).pdf VIP
- 2026年地理生物会考真题试卷(+答案).docx VIP
- 2025年广东省中考化学试题(含答案)原卷.pdf VIP
- 临床药学副高考试题库及答案.doc VIP
- 造价咨询人员保障措施完善方案.docx
- A S T M A106-2018高温用无缝碳钢管的标准规范 CN.pdf
- SONY索尼 α7 RIII(ILCE-7RM3)说明书.pdf VIP
- 2026年中考语文作文专项复习:托物言志写作指导课件.pptx VIP
- 2026年山东济南市历下区中考一模语文试题(试卷+解析).docx VIP
原创力文档

文档评论(0)