汉英对应语料库的检索及应用.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
汉英对应语料库的检索及应用

汉英对应语料库的检索及应用摘要:英汉双语对应语料在经过对齐标注校对入库之后,便转化为可管理的数据库系统。为使这一宝贵的语言资源能够更好地服务于翻译教学,我们制作了一个前端用户访问后台数据库的服务接口,通过较好的人机交互界面,提供一个对双语语言事实进行更多复合条件查询的检索系统。本文简要介绍这一系统的设计开发思想及其应用 关键词:汉英对应语料库;检索系统;翻译句对 中图分类号:H319.3 文献标识码:A 文章编号:1001―5795(XX年代的文本。由于对应语料库在句子层面实施了对齐,因此有可能从某种语言的字词出发,找到包含该字词的句子,再输出与该句子对应的另一种语言的句子,从而完成从一种语言检索另一种语言的检索任务 以下我们从汉语出发,介绍如何利用检索工具来检索动宾关系的“克服困难”在英语中是如何体现的。假定对文体、时代等其他属性不做限制。语料规模为英汉汉英对应语料库中的XX年是克服了最大的困难才集中了全身的力量说出话来的,但是他的神色却起着可怕的强调作用 其中,例(1)英语原文是“things(事情)”,译成汉语时,根据与其构成动宾关系的动词短语contend with具有“对付困难或不愉快事情”的意义,而将“事情”具体化汉译为带有不好意味的“困难”。例(2)是完全增译,原文只是一句简短的表示虚拟语气的感叹句,经过翻译使“赢得爱伦”需要花费很大精力才能完成,这种艰辛变得更为凸显。例(3)和例(4)增译了“克服”,原文中并没有突出“克服”,只是强调了“把它压下去”和“说出话来”具有一定的难度,间接表明要完成这些事情需要有一些特别的处理,因而汉译中加入了对困难的处理――“克服”这一原本没有的词语 4、结语 在确定研究对象和目标后,我们搜集、整理、加工、标注好语料,建起了较大规模的汉英对应语料库。我们将语料库以关系型数据库方式存储,以便能够更方便地使用数据库管理系统实现数据的存储、管理和检索。考虑到广大翻译用户的计算机技术实际,提供了一个简单方便的访问手段。通过良好的用户交互界面,能够生成合适的数据库查询语句,这使翻译研究和学习者无需掌握复杂的计算机指令和更多的计算机操作技能,就能及时方便地利用经过语言学家和翻译学家精心整理加工的双语对应语料库 当前对应语料库的检索系统实现了语言学特定词、词类及其两者的混合查询;能够从某一语言出发实现双向翻译单位的检出;能够根据翻译文本的外在属性的不同实现限定检索;还能够完成限制某词出现的过滤检索等。输出结果为HTML形式,查询词语高亮显示,方便对返回结果集进行二次检索以及对结果的显豁观察。对当前的检索系统善加利用,是能够从翻 译文本中找到一些有趣的、值得深思的现象的 限于现有语料的加工处理深度,当前我们采用检索词语以句间共现作为例句检出的依据。在保证检出率的情况下,准确率将受到一定影响。虽然为人工翻译研究与教学服务的检索系统由于有人工的参与,将召回率作为第一优先的考虑,但可以考虑适当引入浅层语法分析,以增加准确率的选项(Lin,2003)。另外系统当前还是采用查询词语出现与不出现的布尔查询模式,今后可以借鉴信息检索向量空间检索模式,实现近似句的查找 基金项目:本文系教育部人文社科基金项目“基于语料库及对应词表的英语特异组合研究”(09YJA740013)和国家社科基金重大招标项目“大规模英汉平行语料库的建立与加工”(10ZDl27)的研究成果之一 参考文献 [1]Koehn,P.Europarl:A parallel corpus for statistical ma―chine translation[A].MT Summit,2005. [2]Lin,D.Dependency-based Evaluation of MINIPAR[A].InAbeill6,A.(Ed.).Treebanks:Building and Using ParsedCorpora[c].Netherlands:Kluwer,2003:3 17―329. [3]Xiong w.Collocations studies from Chinese English learner’sperspective[A].Proceedings of International conference onIntelligent Computing and Cognite Informatics[c].IEEEComputer Society,2010. [4]王克非,双语对应语料库:研制与应用[M],北京:外语教学与研究出版社,2004 [5]王克非,熊文新,用于翻译教学与研究的英汉对应语料库的加工处理[J],外语电化教学,2009(6) [6

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档