翻译ppt研讨.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
翻译ppt研讨

机器翻译;机器翻译的应用;机器翻译的相关软件;机器翻译的相关软件 ;机器翻译的相关软件;什么是机器翻译;基于规则的机器翻译系统;本质 机器翻译的本质是人类思维和语言活动的模拟 (输入)原语 分析 转换 生成 目的语(输出);基于规则的机器翻译系统,其规则主要包括词法,句法,短语规则,转换生成语法等。它大致可分为三种类型: ●直接翻译 ●结构转换翻译 ●中间语翻译;一、直接翻译系统 直接翻译系统是把原语中的单句或句子直接替换成相应的目的语的单句和句子,必要时对语序进行适当的调整。 这是机器翻译的最初构想,一般在单词的层面上进行,即从目的语中寻找与原词汇相对应的单词,它相当于现在的电子词典,只是翻译的不是单个词汇,而是句子中所有词汇。发展后期,加入了一些简单的句法甚至语义规则,对替换后的词语进行重新排序,生成目的语文本 SL输入 形态分析 双语字典查询 词序调整 TL输出 ;; 由于原语与目的语在句子语法结构上千差万别,翻译出来的句子的可读性可想而知。但它毕竟迈出了机器翻译的最实质的一步,是机器翻译从梦想到现实的一次飞跃。;二、转换系统 转换系统通常包括分析,转换和生成这三部分,其中从原语向目的语的转换是该系统的核心。 在1957年,美国学者V.Yingve提出过机器翻译的三个阶段: ?用代码化的结构来标注原语的句子结构。(分析阶段) ?把原语句子的结构标志转换为目的语句子的结构标志。(转换阶段) ?由目的语句子结构标志生成目的语句子。(生成阶段) ;以上是法国人B.Vouquois对这三个阶段的诠释;; 机器翻译中,从原语句子的表层结构到其深层结构需要经过词法,句法,语义等分析。形成的深层结构是一种句法树(syntax tree)。它反映的是一个句子内部的语法结构,这种结构被认为是人类抽象思维的逻辑表达式,人们相信,不同的语言具有相同和相似的深层结构。就像一座桥梁,把人类不同的语言连接起来,使彼此可以翻译交流。;三、基于中间语的机器翻译 自然语言大多一个单词有多种意思,容易产生歧义。在机器翻译中,为了简化纷繁复杂的表达结构,避免其含糊不清的语义现象,人们设计出一种计算机语言,它独立于各种自然语言,同时又能够清晰准确的表达各种自然语言。这种通用的人造语言,就是中间语。 基于中间语的机器翻译原理就是在不同语言之间建立一个通用的语义—句法表达式,翻译时先将原语转换成这种通用的语义—句法表达式,然后再将这种语义—句法表达式转化成目的语。如图所示:; SL 中间语(IL)表达式 TL合成 SL词典和语法库 SL词典 TL词典和语法库; 人类语言复杂多变,要使中间语来对应翻译多种语言绝不是一朝一夕的功夫,正如法国人斯莱德指出的:如果要设计出一种元语言(中间语言)用来翻译,那么它就必须包含语言的所有特征。这种努力不仅毫无止境,而且很可能毫无结果。”;机译原理;塔多思(Tradoser);常见语料库:; 对机器翻译用处最大的要数平行语料库,又称双语语料库(bilingual corpora)。它是两种语言互译文本的集合,其中存储大量真实的翻译例句,由研究人员从无数真实的翻译文本中搜集遴选整理而成,是双语在段落、句子乃至单词短语层次上对齐的互动语料库,广泛地应用于语言翻译(包括机器翻译)和语言对比研究。; 对现有的语料库进行深层次的开发和研究是现在语料库建设的关键。它包括对原始材料进行词性、语法、句子结构、语音、语义、语篇乃至语用上附码标记,以及双语(尤其是按长度和译词数目进行的句子层面上的)对齐。标记准确、对齐合理,非常有利于计算机自动高效地检索,从而得出理想的翻译。; 基于语料库的机器翻译系统又可细分为基于统计的(statistics-based)和基于实例的(example-based)两类。; 翻译的问题其实就是信息传递的问题,即用语言B准确或近似的再现语言A的

文档评论(0)

cc880559 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档