基于关联度和词对齐的双语组块获取研究-计算机应用技术专业论文.docxVIP

基于关联度和词对齐的双语组块获取研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联度和词对齐的双语组块获取研究-计算机应用技术专业论文

声 声 明 本学位论文是我在导师的指导下取得的研究成果,尽我所知,在 本学位论文中,除了加以标注和致谢的部分外,不包含其他人已经发 表或公布过的研究成果,也不包含我为获得任何教育机构的学位或学 历而使用过的材料。与我一同工作的同事对本学位论文做出的贡献均 已在论文中作了明确的说明。 研究生签名:垄L龟基一 。g年‘月7罗日 学位论文使用授权声明 南京理工大学有权保存本学位论文的电子和纸质文档,可以借阅 或上网公布本学位论文的部分或全部内容,可以向有关部门或机构送 交并授权其保存、借阅或上网公布本学位论文的部分或全部内容。对 于保密论文,按保密的有关规定和程序处理。 研究生签名:圭:】垫蔓 D,年√月嘭日 硕士论文 硕士论文 基于关联度和词对齐的双语组块获取研究 1引言 1.1研究背景及意义 1.1.1研究背景 计算语言学是一门以计算为手段对自然语言进行研究和处理的科学,是--I-J数 学、语言学、计算机科学相互交叉的学科。自然语言处理是计算机科学领域与人工智 能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的 各种理论和方法。 计算语言学和自然语言信息处理研究的核心问题是语言的自动理解(Language Understanding)和自动生成(Language Generation)。前者从句子表层的词语符号串识 别句子的句法结构,判断成分之间的语义关系,最终弄清句子表达的意思;后者从要 表达的意思出发选择词语,根据词语间的语义关系构造各个成分之间的语义结构和句 法结构,最终造出符合语法和逻辑的句子. 自然语言信息处理的应用目标是使人与计算机之间用自然语言进行交流。具体 说,是建立各种处理自然语言的计算机应用软件系统,譬如:机器翻译、自然语言理 解、语音自动识别与合成、文字自动识别、计算机辅助教学、信息检索、文本自动分 类、自动文摘,还有文本中的信息提取、互联网上的智能搜索,以及各种电子词典和 术语数据库。 随着中国加入WTO后国际国内市场交流与融合步伐的加快,翻译市场正以前所 未有的速度迅猛发展;尤其是2008年北京奥运会、2010年上海世博会的举行更给翻 译市场的发展带来难得的发展机遇。随着因特网的应用范围的扩大和国际间电子商务 市场的日渐成熟,到2007年,仅网页翻译业务就将达17亿美元的市场规模。与巨大 的翻译需求极不协调的是我国翻译能力严重不足。目前我国的翻译市场规模虽然超过 百亿,但现在国内的翻译公司仅能消化10%左右。由于无法消化来自国际的信息流, 导致我国在国际竞争中失去大量的商业机会。因此,在目前翻译速度和数量上都大大 超过了以往规模的情况下,传统的人工翻译方式已远远不能满足实际的需要。机器翻 译及其相关技术的不断问世和成熟,可望能从根本上解决这一难题。 事实上,机器翻译已经成为当前国际上竞争激烈的研究领域之一,发达国家不惜 投入巨额资金开展全国性或多国性的联合攻关。 因此,机器翻译的研究既具有重大的学术理论意义,又具有广泛的实际应用前景。 硕士论文 硕士论文 基于关联度和诃对齐的双语组块获取研究 1.1.2机器翻译概述 1.1.2.1机器翻译的基本概念 机器翻译(machine translation,MT)是自然语言理解最早的一个研究分支,它是利 用计算机把一种自然语言转变成另一种自然语言的过程。完成这一过程的软件叫做机 器翻译系统。 自然语言理解的研究,最初就是从机器翻译开始的。随着信息时代的到来,。信 息爆炸”成为信息处理领域的瓶颈问题,不同语种之间大量的信息交流加大了问题的 严重性。不同语言之间的翻译工作要求越来越迫切,并且工作量也越来越大。如何利 用计算机高效率的信息处理能力突破不同语种之间的语言障碍,成为全人类面临的共 同问题。机器翻译便是解决这个问题的有力手段之一.因此,机器翻译长期处于自然 语言处理研究中心地位。 1.1.2.2机器翻译的发展过程 关于利用机器来进行语言翻译的想法,远在古希腊时代就有人提出过了。但是真 正进入深入思考是从上个世纪中期开始的。1946年,美国美国宾夕法尼亚大学的埃 克特(J.P.Eckert)和莫希莱(J.W.Mauchly)设计并制造出了世界上第一台电子计算 机ENIAC,同年,在英国工程师布斯(A.D.Booth)和美国洛克菲勒基金会副总裁 韦弗(w:Weaver)讨论电子计算机的应用范围时,正式提出了利用计算机进行语言 自动翻译的想法。 在随后的十几年中,机器翻译取得了突飞猛进的发展。1954年,美国乔治敦大 学在国际商用机器公司(IBM公司)的协同下,用I

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档