- 1、本文档共47页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
小学语文《》酿
机器翻译概述
常宝宝
北京大学计算语言学研究所
chbb@pku.edu.cn
什么是机器翻译
研究目标:研制出能把一种自然语言(源语言)的文
本翻译为另外一种自然语言(目标语言)的文本的计
算机软件系统。
制造一种机器,让使用不同语言的人无障碍地自由交
流,一直是人类的一个梦想。
随着国际互联网络的日益普及,网上出现了以各种语
言为载体的大量信息,语言障碍问题在新的时代又一
次凸显出来,人们比以往任何时候都更迫切需要语言
的自动翻译系统。
但机器翻译是一个极为困难的研究课题,无论目前对
它的需求多么迫切,全自动高质量的机器翻译系统
(FAHQMT)仍将是人类一个遥远的梦。
机器翻译的基本方法
机器翻译的基本方法 目前没有任何
一种方法能实现机
基于规则的机器翻译方法
器翻译的完美理
直接翻译法 想,但在方法论方
转换法 面的探索已使得人
中间语言法 们对机器翻译问题
基于语料库的机器翻译方法 的认识更加深刻,
基于统计的方法 而且也确实带动了
不少不那么完美但
基于实例的方法 尚可使用的产品问
混合式机器翻译方法 世。
机器翻译的基本方法
20世纪90年代以前,机器翻译方法的主流一直是基于
规则的方法,因此基于规则的方法也称为传统的机器
翻译方法。
直接翻译法
逐词进行翻译,又称逐词翻译法(word for word translation)
无需对源语言文本进行分析
对翻译过程的认识过度简化,忽视了不同语言之间
在词序、词汇、结构等方面的差异。
翻译效果差,属于早期过时认识,现已无人采用
How are you ? 怎么是你?
How old are you ? 怎么老是你?
机器翻译的基本方法
中间语言法(interlingua approach)
中间语言(interlingua)是一种中间表达,通常是一种句
法-语义表达(syntactic-semantic expression) ,中间语言独立
于任何具体的自然语言。
源文本经过深层分析得到源语言的中间语言表示。
再由该中间表示生成目标语文本。
翻译过程为两个阶段。
机器翻译的基本方法
不同系统采用不同的中间语言,有的是一种逻辑形
式的语言,有的甚至采用类似自然语言的人工语
言,如:荷兰政府支持的DLT计划采用世界语
Esperanto做中间语言。
中间语言法在理论上非常经济,可有效减少翻译模
块的数量。可把n(n-1)个直接翻译模块减少为2n个
翻译模块。
机器翻译的基本方法
把任何一种自然语言翻译成为一种独立的中间语
言,需要深层次的语言分析和生成技术,目前没有
特别成功的基于中间语言的机器翻译系统。
转换法(transfer approach)
文档评论(0)