机器翻译和自动摘要.ppt

  1. 1、本文档共63页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
机器翻译和自动摘要

自然语言理解(Natural Language Understanding,NLU),也称为计算语言学(ComputationalLinguistics),是研究如何利用计算机来理解和生成自然语言的理论和方法? .它是人工智能三大研究方向之一;是一门自然科学和社会科学交叉的学科,特别是计算机科学、数学、语言学、心理学和哲学相互交叉的科学。 ;自然语言就是我们生活中使用的语言,如汉语、英语、日语等等.它是相对于人工设计的形式化的计算机语言如Basic、Fortran、C、Lisp等等而言的.随着社会信息化程度的提高,人们越来越重视NLU技术的研究.其研究成果已经在机器翻译、信息检索、自然语言人机接口等重要领域得到应用。 机器翻译(Machine Translation,MT)是自然语言处理中的一个最早的研究分支, 它是利用计算机把一种自然语言转变成另一种自然语言的过程。用以完成这一过程的软件叫做机器翻译系统。;机器翻译和自动文摘;机器翻译内容提要;什么是机器翻译;一些研究领域;机器翻译的发展历史;国外状况(1);国外状况(2);国外状况(3)---低潮期机译研究;肿频捞脆梨睛姚枉讳吸浴钎切箕塌丧垃揣搔魂控淹腹垃刊仪亏您紫肾藩资机器翻译和自动摘要机器翻译和自动摘要;国外状况(4)--复苏;机器翻译的平台期;就在机器翻译进入平台期的时候,一些新的因素也在萌芽 –基于实例的机器翻译思想 –基于统计的机器翻译思想 –互联网的出现大大促进了机器翻译的需求;机器翻译新热潮;机器翻译的新热潮;机器翻译新热潮;埃健莱人伟藩颇烹斗嫉惭庭退痉匡缨定戒饲瞻延溶琴示湿桐寨葡患蝴衙谗机器翻译和自动摘要机器翻译和自动摘要; 国内状况;国内状况;国内状况;机器翻译现状(面临问题); 在结构层面上,常见的结构歧义有 and(和)结构,如 nice girls and boys, 它既可表示“好女孩和男孩”,也可表示“好女孩和好男孩”,这种歧义只有人工翻译才能消除,计算机无法识别此歧义,可见歧义的处理是影响机器翻译质量的关键。? ;;例1,文学翻译是“传达作者的全部意图,即作者对在读者思想感情上产生艺术作用的全部意图”。即使对于专业翻译工作者来说,文学翻译也不是件容易的事,更何况是对于没有任何认知能力的机器。以下是美国19世纪著名作家爱默森长篇散文Beauty中的原句。?   原文:“But this beauty of Nature which is seen and felt as beauty, is the least part.”?   —Beauty Ralph Waldo Emerson?   机器译文:但是这哪个看见并且作为美丽感到的自然的美丽,是最小部分。?   夏济安译文:可是凡是耳目所能辨认出来的美,只是自然之美的最低部分。? ;例2:美国著名作家马克.吐温早期优秀小说《竞选州长》中的原句。 原文:I hauled down my colors and surrendered.?   —Running For Governor Mark Twain 机器译文:我沿着我的颜色拖并且投降。? 张有松译文:我偃旗息鼓,甘拜下风。?   由于机器没有思维、推理、判断能力,缺乏人工译者的综合知识和长期积淀下来的文化知识等,无法对原文产生全面的了解,做的只是机械转码,无法突破思维障碍。要获得地道完整的译文,必须对机器译文进行人工修改、加工。? ;机器翻译的方法;机器翻译的四种实现方法;基于分析和转换的机器翻译方法;基本原理 一般情况下,分析以句法为主、语义为辅, 正确的句法结构转换加正确的词汇译文可以从源语言向目标语言传递完整的正确信息。因此,以句法结构转换附加一定的语义信息, 能够构成转换的基本层次,就标准的机器翻译系统来说, 句子和短语层次的结构转换是机器翻译转换部分的研究重点, 这方面一般采用一下产生式方式的转换规则形式。 ;转换规则形式: S:S1+S2+‥+SiC1 C2‥Ck→T1+T2+‥+Tj:T 上式理解为S是SL(源语言)的某个待翻译单位(句子、短语等等),S1~S2 是S中的下一级组成单位;对于S,如果满足条件C1 C2‥Ck , 则TL(目标语言)中有T1~Tj译文构成了相应的等价物T。 上述方法称为基于句法的转换方法, 因为S1+S2+‥+Si一般来说就是源语言的的句法结构表示;也可以称为直接转换方法, 因为对于每个源语言的翻译组块, 都马上给出一个目标语言组块与之对应。应该说, 这种转换方法符合人的直觉认识, 也能够实现。;基于中间语言的翻译方法;基于中间语言的机器翻译方法的优势是无需一种语言到另一种语言的一一转换, 对于多语种的翻译系统可以节约大量的转换知识的手工获取工作量。假如有N种语对需要

文档评论(0)

jgx3536 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档