第二组《勒曼谈机器翻译》外12.11李佩赵思雨详解.ppt

第二组《勒曼谈机器翻译》外12.11李佩赵思雨详解.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
她 放 一 束 花 上 桌 。 She put a bunch flower on table . 6)目标语言词串的生成 利用得到的目标语言句法结构以及经过译词选择得到的目标词语生成目标语言词串. 机器翻译方法分类--RBMT s of s 机器翻译方法分类--RBMT (三)RBMT的优点和缺点 1. 规则的主观性强,规则的一致性难以保障; 2.知识获取难、工作量大; 3.不利于系统扩充,尤其对非规范的特殊语言现象缺乏相应的处理能力。 1. 不同语种在语法上的依存度很低、处理能力较强; 2. 具有对知识表达的抽象程度高、代表性强的特点; 3.对文法结构具有很强的保持能力。 机器翻译方法分类--SBMT 二、基 于 统计的方 法 (一)概念理解 · SBMT是一种间接地使用语料库的机器翻译方法,将语料库作为获取翻译规则信息的依据,通过相关概率的计算,使用纯数学的方法对待译文本进行“翻译”(转换) 。 ----《基于实例英汉翻译系统研究与实现》 · 思想萌芽——Weaver发表的以《翻译》为题的备忘录中就提出:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。” 机器翻译方法分类--SBMT (二)SBMT分类 基于统计的机器翻译方法大体上分为以下三类 ·一种语言中的任何一个句子都有可能是另外一种语言中某个句子的译文,只不过可能性大小不同,而取可能性最大的那个译文应该是风险最小的。 ——《基于语义语言机器翻译系统的若干问题的研究》 机器翻译方法分类--RBMT 基本思想是——把机器翻译看成是一个信息传输的过程,用一种信源信道模型对机器翻译进行解释。 (二)基于信源信道模型的统计机器翻译方法 S 噪声信道 T 源语言 目标语言 输入 输出 机器翻译方法分类--SBMT (三)SBMT的优点和缺点 1. 资源丰富, 易于实现; 2.良好的统计翻译模型能够融合更多的句法结构和语义 、语法信息; 3.统计机器翻译的翻译性能可通过大规模语料训练进行改善。 1. 系统运行消耗的资源巨大,需要大规模双语平行语料库进行训练学习,语料的选择和处理工程量也很巨大。 2.有些词出现频率低、用法不常见,统计模型就无法准确判断词义和词的位置。 机器翻译方法分类--EBMT 二、基 于 实例的方 法 ·思想萌芽——长尾真指出:“人类在翻译一个简单句子的时候,并不会作深层次的语法分析,而是首先将源语句适当地分为若干短语片段然后再把这些短语翻译成目标语言,最后把翻译好的短语片段恰当地组合成为一个句子。而对每一个短语片段则是用相应的例子作为参考,通过类推原则进行翻译的。” 模仿人类翻译外语过程中的基本模式 将源语句分解为短语片段并在一个实例库的基础上对其进行匹配 确定这些短语片段所对应的目标语言的短语片段 将翻译好的目标语言的短语片段进行适当重组,构成一个完整的目标语言句子 (一)概念理解 匹配 对齐 重组 机器翻译方法分类--EBMT (二)基本原理 ·EBMT在译文转换时,从实例库中搜索出一个与输入句最相似的例句,并仿照实例库中例句的翻译方式进行输入句的翻译。 源语言S 最相似句S’ 模拟S’的译语T’构成S的译语T 例 将“We are studying Chinese.” 译成中文 源语言S We are studying Chinese. 最相似句S’ We are studying English. 我们正在学习英语。 We are researching Chinese. 我们正在研究汉语。 模拟S’的译语T’构成S的译语T 我们正在学习汉语。 机器翻译方法分类--EBMT (三)EBMT的优点和缺点 1.相似度计算困难; 2.大规模获取语言知识的代价非常大,对于词法、语法和语义规则的概括难以全面。 1、不需要编写规则; 2、系统容易维护; 3、容易产生高质量译文; 4、需要的相关语言知识少。 3.覆盖率低 4.存在匹配错误和对齐问题 机器翻译方法分类--小结 小结 ·基于规则和基于语料库的机器翻译方法优缺点各异,使用不同方法研制的机器翻译系统的性能表现也不尽相同, 对译文质量的保障程度深浅不一,翻译精度也还不尽如人意。 ·如何通过规则和语料库方法的有机结合,实现相互取长补短的新理论和新方法,是机器翻译研究人员普遍关注的研究热点。 (一) 回顾 一般机器翻译的方法 因语法、词汇、句法发生变化或不规则,出现错误在所难免 机器

您可能关注的文档

文档评论(0)

三四五 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档