- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
10万的记忆库如何发挥出百万的作用?
EBMT技术的应用,充分发挥记忆库的作用。
目前的CAT软件主要采用的是TM技术,即翻译记忆(Translation Memory, TM),TM技术要求两句的相似度要非常高;对两句间不同的部分,一般只能自动替换其中的非译元素,如数字等。所以,记忆翻译质量的如何,很大程度上取决记忆库的规模,记忆库越大、覆盖面越广,翻译的质量自然越高。但是,记忆库不是无中生有的,而是靠译员苦心积累下来的;如何提高记忆库的利用率,让10万的记忆库发挥出百万的作用?这对我们译员来说相当有价值!
而EBMT(Example-Based Machine Translation基于实例的机器翻译)技术可以比较好的解决这一问题,例如:首先告诉计算机:“Herry is a student, he was born in 2000. 亨利是一个学生,他出生于2000年。”这一句的翻译。接下来的这一句“Anna is a teacher, she was born in 1976.”计算机能通过对上一句的类比和学习,自动替换翻译出“安娜是一个教师,她出生于1976年。”此外,对两句看起来相差较多的句子,也可通过对其中一句学习,自动替换翻译出另外一句,如对“America is a scientic country. ”和“He is a student.”这两句,表面看起来相似度不高,但雪人同样可以通过对:“America is a scientic country. 美国是一个科学技术发达的国家。”这一句的学习,准确翻译出“He is a student. 他是一个学生。”这些在一般的CAT软件中由于匹配度不高,会认为是两句完全不同的句子,那么记忆库中的那句就不会对当前句有贡献。下面我们来看看记忆库是如何充分发挥作用的?
(1). 一般的替换翻译:
当我们翻译了第一句:“Herry is a student, he was born in 2000. 亨利是一个学生,他出生于2000年。”后,接着翻译第二句:“Anna is a teacher, she was born in 1976.”这时在屏幕下方的“句子比较”窗口中,已经根据对第一句学习给出了“安娜是一个教师,她出生于1976年。”的正确译文,点击旁边的 “引用译文”按钮,即可将译文引用到上面。上方显示的是当前句,下方显示的是记忆库的参考例句,并以不同字体颜色、底色、下划线等区分当前句子与记忆库的匹配句子的不同之处和两句之间的对应关系,以便译员查找两句中各词的对应关系。对于这两句,一般的CAT软件只能替换翻译数字,即将2000替换成 1976,不能将Herry替换Anna、student 替换teacher、he替换she。
(2). 增词替换翻译:
当翻译第三句:“Davis is a part-time teacher, he was born in 1982.”这一句与刚才的那两句相比,结构仍旧相似,但增加了一个词“part-time”,软件在合适的位置插入了“兼职的”这几个字,如下图:“戴维斯是一个兼职的教师,他出生于1982年。”而且对增词部分“part-time、兼职的”以绿色字体显示,以提醒译员注意该部分是否翻译正确。
(3). 减词替换翻译:
当翻译“We were watching a movie.”这一句时,软件自动从记忆库中搜索出相似度只有0.57的“They were watching a beautiful sunset. 他们在观看美丽的日落。”这一句,并以它做模板正确将“We were watching a movie.”翻译为“我们在观看电影。”而且对减词部分“beautiful 美丽的 ”以绿色字体显示,以提醒译员注意该部分是否翻译正确,如下图。这两句看似并不怎么相似,但一样可以很好地利用记忆库的“They were watching a beautiful sunset.”来为当前句服务,这在一般的CAT软件中是做不到的。
(4). 方便的短语提取
当我们翻译“Havent you heard that Ill married soon?”这一句时,从记忆库中找到了相似度0.79的“Havent you heard that hell get a promotion soon? 你难道没听说他不久就要晋升了吗?”这一句做参考,但软件并没有将“晋升”自动替换为“结婚”二字,刚才那些相似度只有0.57的都可以正确替换,为什么这个相似度更高的却不能正确替换呢?如下图“句子对比”窗口下方的从记忆库搜索出的那句,其原文、译文都加了红色的下滑线,这是因为在我们的词典中找不到 “Havent 难道没”、“ get
您可能关注的文档
最近下载
- 金融市场与金融机构(原书第9版)教学课件Mishkin_fmi09_ppt_04.pptx VIP
- ISO90012024版质量管理体系推行计划 .pdf VIP
- 金融市场与金融机构(原书第9版)教学课件Mishkin_fmi09_ppt_03.pptx VIP
- 金融市场与金融机构(原书第9版)教学课件Mishkin_fmi09_ppt_05.pptx VIP
- 金融市场与金融机构(原书第9版)教学课件Mishkin_fmi09_ppt_07.pptx VIP
- 飞行程序设计-第3章 编码.ppt
- 一维数组的定义与初始化课件(共14张PPT)—《C语言程序设计》(电子工业版).pptx VIP
- 缝纫机说明书-JUKI.PDF
- 员工手册(公司通用版).docx VIP
- 金融市场与金融机构(原书第9版)教学课件Mishkin_fmi09_ppt_02.pptx VIP
文档评论(0)