- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
语言信息处理--机器翻译I
语言信息处理--机器翻译I 机器翻译IMachine Translation I 张宇 哈尔滨工业大学计算机科学与技术学院 zhangyu@ir.hit.edu.cn 大纲 机器翻译的历史 机器翻译的分类 机器翻译的范式 机器翻译的基本策略 基于规则的机器翻译方法 基于实例的机器翻译方法 机器翻译的历史 W. J. Hutchens, latest Development in MT Technology: Beginning a New Era in MT Research. In : Proceedings of Machine Translation Summit-IV, Kobe, Japan, 1993. 冯志伟,自动翻译,上海知识出版社,1987年。 冯志伟,自然语言机器翻译新论,语文出版社,1994年。 冯志伟,自然语言的计算机处理,上海外语教育出版社,1996年。 机器翻译的萌芽期(1) 关于用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。 在17世纪,一些有识之士提出了采用机器词典来克服语言障碍的想法。 笛卡儿(Descartes)和莱布尼兹(Leibniz)都试图在统一的数字代码的基础上来编写词典。在17世纪中叶,贝克(Cave Beck)、基尔施(AthanasiusKircher)和贝希尔(Johann Joachim Becher)等人都出版过这类的词典。由此开展了关于“普遍语言”的运动。 维尔金斯(John Wilkins) 在《关于真实符号和哲学语言的论文》(An Essay towards a Real Character and Philosophical Language, 1668)中提出的中介语(Interlingua)是这方面最著名的成果,这种中介语的设计试图将世界上所有的概念和实体都加以分类和编码,有规则地列出并描述所有的概念和实体,并根据它们各自的特点和性质,给予不同的记号和名称。 机器翻译的萌芽期(2) 本世纪三十年代之初,亚美尼亚裔的法国工程师阿尔楚尼(G.B. Artsouni)提出了用机器来进行语言翻译的想法,并在1933年7月22日获得了一项“翻译机”的专利,叫做“机械脑”(mechanical brain)。 这种机械脑的存储装置可以容纳数千个字元,通过键盘后面的宽纸带,进行资料的检索。阿尔楚尼认为它可以应用来记录火车时刻表和银行的帐户,尤其适合于作机器词典。在宽纸带上面,每一行记录了源语言的一个词项以及这个词项在多种目标语言中的对应词项,在另外一条纸带上对应的每个词项处,记录着相应的代码,这些代码以打孔来表示。机械脑于1937年正式展出,引起了法国邮政、电信部门的兴趣。但是,由于不久爆发了第二次世界大战,阿尔楚尼的机械脑无法安装使用。 机器翻译的萌芽期(3) 1903年,古图拉特(Couturat)和洛(Leau)在《通用语言的历史》一书中指出,德国学者里格(W. Rieger) 曾经提出过一种数字语法(Zifferngrammatik),这种语法加上词典的辅助,可以利用机械将一种语言翻译成其他多种语言,首次使用了“机器翻译” (德文是ein mechanisches Uebersetzen)这个术语。 1933年,苏联发明家特洛扬斯基(П.П.ТРОЯНСКИЙ)设计了用机械方法把一种语言翻译为另一种语言的机器,并在同年9月5日登记了他的发明。1939年,特洛扬斯基在他的翻译机上增加了一个用“光元素”操作的存储装置;1941年5 月,这部实验性的翻译机已经可以运作;1948年,他计划在此基础上研制一部“电子机械机” (electro-mechanical machine)。但是,由于当时苏联的科学家和语言学家对此反映十分冷淡,特洛扬斯基的翻译机没有得到支持,最后以失败告终了。 机器翻译的草创期(1) 1946年,美国宾夕法尼亚大学的埃克特(J. P. Eckert)和莫希莱(J.W.Mauchly)设计并制造出了世界上第一台电子计算机ENIAC,在电子计算机问世的同一年,英国工程师布斯(A. D. Booth)和美国洛克菲勒基金会副总裁韦弗(W. Weaver)在讨论电子计算机的应用范围时,就提出了利用计算机进行语言自动翻译的想法。 1947年3月6日,布斯与韦弗在纽约的洛克菲勒中心会面,韦弗提出,“如果将计算机用在非数值计算方面,是比较有希望的”。 在韦弗与布斯会面之前,韦弗在1947年3月4日给控制论学者维纳(N.Wiener)写信,讨论了机器翻译的问题,韦弗说:“我怀疑是否真的建造不出一部能够作翻译的计算机?即使只能翻译科学性的文章(在语义上问题较少),或是翻译出来的结果不怎么优雅(但能够理解),对我而言都值得一试。”可是,维纳在4月30日给韦弗
文档评论(0)