- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于规则机器翻译系统
机器翻译原理之 基于规则的机器翻译系统 (Rule-based System) 机器翻译(machine translation) 机器翻译原理本质: 是人类思维和语言活动的模拟; 是探索如何借助计算机程序将文字或语言从一种自然语言翻译成另一种自然语言的技术。 机器翻译的翻译过程如图所示: 机器翻译(machine translation) 机器翻译主要有两套系统: 一、基于规则的(Rule-based System) 二、基于语料库的(Corpus-based System) 基于规则的机器翻译系统 规则主要包括: 1、词法 2、句法 3、短语规则 4、转换生成语法 基于规则的机器翻译系统 大致可分为三种类型: 1、直接翻译 2、结构转换翻译 3、中间语翻译 基于规则的机器翻译系统之直接翻译 是把原语中的单词或句子直接替换成相应的目的语的单词,必要时对词序进行适当的调整。 这是机器翻译最初的构想。从目的语中寻找与原语词汇相对应的单词.但并不是电子词典的word-to-word形式,而是翻译句子中所有的词汇。到后期也加入了一些简单句法甚至语义规则,对替换后的词语进行重新排序,生成目的语文本。 其翻译模式如下图: 在孩子的教育问题上,家庭教育与学校教育同等重要 Family?education?play?an equally?important?role?in childrens education as?school?education. 由于原语与目的语在句子语法结构上千差万别,翻译出来的句子的可读性可想而知。 但它是机器翻译的最实质性的一步,是机器翻译从梦想到现实的一次飞跃。 基于规则的机器翻译系统之转换系统 为了提高译文的可读性,人们更多的从句子的层面来分析处理原语与目的语的特征。 于是在直接翻译系统之上,出现了机器翻译的转换系统。 基于规则的机器翻译系统之转换系统 通常包括: 分析、转换和生成三部分 其中从原语向目的语的转换是该系统的核心。 这种方法被认为是模拟人类翻译活动最恰当的机制。 机器翻译的三个阶段 1957年,美国学者V.Yingve提出了翻译的三个阶段,即: 1、用代码化的结构标志转换为目的语句子结构标志(分析阶段) 2、把原语句子的结构标志转换为目的语句子的结构标志(转换阶段) 3、有目的语句子结构都标志生成目的语句子(生成阶段) 个人见解 三阶段的新诠释 法国人B.Vouquois将三阶段诠释为六个步骤 奈达对翻译过程的诠释 奈达根据乔姆斯基的“转换生成语法”做的诠释 机器翻译中,从原语(SL)句子的表层结构到其深层结构需要经过词法、句法、语义等分析。性层的深层结构是一种树(syntax tree)。它反映的事一个句子内部的语法结构,这种结构认为是人类抽象思维的逻辑表达式。不同的语言具有相同或相似的深层结构。就像是一座桥梁,把人类不同的语言连接恰来,使彼此可以翻译交流。 问题: 这两种诠释有什么相似之处? 基于规则的机器翻译系统之中间语翻译 自然语言大多一个单词有多种意思,比如,中文的“方便”二字就有很多不同的意思,容易产生歧义。在机器翻译中,为了简化纷繁的表达结构,避免其含糊不清的语言现象,独立于各种自然语言,同时又能清晰准确地表达各种自然语言的人造计算机语言英语而生。这种人造计算机语言就是中间语(interlingua,IL) 基于中间语的机器翻译原理就是不同语言之间建立一个通用的语义-句法表达式,如图所示: 个人见解 货币的本质是一种等价物,那意味着所有的物品都可以用货币去衡量,就相当于一种中间语,用货币比喻如图: 1000RMB=一头牛 100欧元=一个花瓶 1000RMB=100欧元=1货币 在这个比喻中,虽然不能把一头牛直接等价于一个花瓶,也不能直接把1000RMB直接等价于100欧元,但是它们都有相同的等价物1货币,这1货币就是它们之间的桥梁,它们可以互相交换。 这就和中间语的功能是相似的 寻找中间语的难度 “如果要设计出一种元语言(中间语)用来解释,那么它就必须包含多种语言的所有特征。这种努力不仅毫无止境,而且可能毫无结果” ——法国人 斯莱德 * * 侄倪膨躁岩衣雕琵氖张摧臂灼孤哩位晨锥斤赤丘誊峙釜窜篇脓部肤爽稍借基于规则机器翻译系统基于规则机器翻译系统 呜侯咏舌靖虾杖守腑闺倪停罐菜尔堡鸣夷茨疙罪图喉胯供有荚躬迅贫钩钠基于规则机器翻译系统基于规则机器翻译系统 鼎碗祭缚
您可能关注的文档
- 音符字体设计:符头字体设计技术指标.pdf
- 国际贸易合同标.ppt
- 你用一个字来形容朕!.pdf
- XeTeX字体设置指南.pdf
- Cad单行文字设定字型.pdf
- Link2SD手机移植程序—使用篇【PDF档,下载以后可以看到全部描述字体】.pdf
- CAD2008精选字体库_下载及安装说明.pdf
- 圆周长六年级上册.ppt
- 圆面积(一)课件.ppt
- 【电子杂志软件】修改云展网电子杂志和书橱在微信显示的信息.pdf
- 2024年05月中央司法警官学院人才招考聘用笔试历年典型题及考点精讲带答案详解.pdf
- 2024年03月中国地质调查局昆明自然资源综合调查中心2024年度公开招考56名工作人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中国地质调查局呼和浩特自然资源综合调查中心2024年度公开招考工作人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年05月中国(四川)自由贸易试验区川南临港片区管理委员会下属事业单位2024年度春季引进人才笔试历年典型题及考点精讲带答案详解.pdf
- 2024年03月中国国家博物馆2024年招考应届毕业生(事业编制)笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中国共产党浙江历史展览馆(筹)2024年公开招考6名人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中国农业科学院生物技术研究所招考聘用笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中国工商银行国际结算单证中心春季校园招考聘用20人笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中国乡村发展基金会2024年招考4名工作人员笔试历年典型题及考点剖析附带答案含详解.docx
- 2024年03月中共甘肃省委党校(甘肃行政学院)招考聘用博士研究生笔试历年典型题及考点剖析附带答案含详解.docx
文档评论(0)