- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语料库与机器翻译译文质量评估
语料库与机器翻译译文质量评估
摘要 语料库语言学的发展对翻译研究产生了很大影响。机器翻译是翻译研究的一项重要内容,且应用越来越广泛。本文从机译译文质量评估的目的入手,探索了译文评估标准,提出了建立机译译文质量评估语料库的设想。
关键词 语料库;机器翻译;译文质量;评估
1 语料库研究与机器翻译研究
1.1语料库研究与翻译研究
语料库是研究语言意义的有力工具。从一个语料库中检索词汇结(node),检索上下文或临近若干个词而组成的并置结构(collocates),并将出现这些结或并置结构的句子(concordance)进行比较分析,可以揭示用常规方法很难发现,或很难确定的语义特征。如果语料库还包括同一作者的若干作品,我们就可以利用语料库来研究作者的语言风格。每个作家有自己的语言习惯,总有反复使用某些词语的偏好,这些词语往往具有某些特殊意义,???作家的个人。
语义特征。而且,语料库还可向我们提供各种各样的语言信息?如语言冗余度的大小、词汇共现和规范程度、句法模式、用词特点等,使我们了解译语文本的文体特征和译者的风格。
除此之外,语料库还有助于探索翻译普遍规律,分析翻译文本的普遍文体特征,预测翻译发展趋势与走向,并对翻译理论家提出的假说与预测进行验证。
因此,自九十年代中期以来,就有一批翻译理论家开始将语料库运用于翻译研究,对翻译的性质和特征进行描述。英国曼彻斯特大学Mo.a Bake。教授还从翻译研究角度对语料库建设和语料库语言学研究提出了特殊的要求和设想。她认为与翻译研究有关的语料库有三类:平行语料库(parallelcorpus)、多语语料库(multilingual corpus)和可比语料库(com-parable corpus)。平行语料库收集某种语言的原创文本和相应的翻译成另一种文字的文本;多语语料库是根据类似设计标准建立起来的两个或多个不同语言单语种语料文本组成的复合语料库。其中的文本完全是原文文本,不收集翻译文本;可比语料库收集某种语言,比如说英语的原文文本,同时也收集从其他语言翻译成英语的文本。
1.2机器翻译研究与机译译文质量评估
机器翻译(machine translation,MT)是在计算语言学理论指导下,实现从一种自然语言(源语言)到另一种自然语言(目标语言)的翻译,又称自动翻译。如果源语言是英语,目标语言是汉语,则称英汉机器翻译。
最早的机器翻译起源于1933年,20世纪50年代后期及60年代前期,美国出现过机器翻译研究的第一次热潮。但1964年美国科学院语言自动处理咨询委员会发表的AI。PAC报告给机器翻译泼了一盆冷水,此后,语言信息处理有过一段沉寂期。从70年代后期开始,由于计算机技术的发展和语言学理论的进步,特别是由于社会日益信息化对自动翻译的需求,在世界范围内,机器翻译研究与实用系统的开发再次得到蓬勃的发展。现在机器翻译已成为在高技术领域进行竞争的热点之一。目前,迅猛发展的网络技术,通过为需要翻译服务的客户提供理想的传递平台(platform for delivering),在各种翻译技术形成连续统一体方面起了重要作用。许多网站现在可为在线浏览(online browsing)和文件摘要(docu-merit gisting)提供翻译服务。作为翻译提供者的网站或许很快会提出运用翻译储存技术来建立在线翻译工厂(onlinetranslation factories),以满足上网顾客的翻译需求。
但是由于自然语言固有的复杂性以及计算机的智能尚未充分发展等多种原因,机器翻译要达到真正的实用目的,还需要攻克一系列的理论与技术难关。
机器翻译评价是对机器翻译系统性能机器译文质量的评价。机器翻译评价对机器翻译的研究开发和推广应用有举足轻重的影响。机器翻译评价也是机器翻译领域的一个重要研究课题。其中关于机器翻译的译文质量的评估是机器翻译评价中最重要也是最有特色的内容。译文质量评估对人来说也是一项十分棘手的任务,“编制一个适当的测试例句集是译文质量评估,甚至也是其它性能指标(如翻译速度)测评的基础。测试集既独立于具体的机器翻译系统,又独立于具体的测试方法。测试集除了包含源语言例句外,也需要附上正确的至少是可供参考的译文。”
2 机译译文质量评估标准
翻译的标准之争由来已久。“信达雅”者有之,“信顺”者有之,“等值论”者有之……不一而足。而对于自然语言的机器翻译而言,情况就很不一样。
只要以数据库文件的形式在计算机系统中建立一部英汉对照的词典,就可以在词汇级上实现英语和汉语的互译,市售的电子词典往往也包含了一些常用的固定短语的对译。不过,任何一种自然语言的句子都是无限集,只有
您可能关注的文档
最近下载
- 思想政治学科教学新论七章 思想政治学科评价论.ppt VIP
- 2025江西南昌青山湖区城市管理和综合执法局招聘工作人员10人笔试参考题库附答案解析.docx VIP
- 04S519:小型排水构筑物.pdf VIP
- GB50017钢结构设计规范.pdf VIP
- 武汉文化投资发展集团有限公司招聘5名工作人员笔试备考试题及答案解析.docx VIP
- 2023全钒液流电池可靠性评价方法.pdf VIP
- [乐高LEGO 9686动力机械]第14课 摩天轮.pdf VIP
- 英语视听说4英语视听说IV教学大纲.pdf VIP
- 基根-《全球营销(第8版)》英文教辅-第4章.pptx VIP
- 基根-《全球营销(第8版)》英文教辅-第3章.pptx VIP
文档评论(0)