- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多特征的翻译自动评价方法研究
计算机科学与技术学院:赖中华 指导教师:杨沐旳
摘 要:针对翻译自动评价问题,使用自然语言处理技术,分析人工翻译评价时考虑的关键翻译质量特征,并尝试建 立一个基于多特征的翻译质最自动评价模型。本文从153篇英汉译文以及对应的专家评分着手,进行了一系 列的翻译质戢特征的自动获取研究,在大最实验的基础上利用线性冋归方法建立翻译自动评价模型,取得和 人工评分较高的相关性。
关键词:翻译质量特征;线性冋归;翻译自动评价
Abstract: This paper, adopting the human translations and its manual assessments, investigates the key translation quality features (TQF) by the technologies of natural language processing. Based on a series of automatically acquired TQFs which are proved relevant to human translation evaluation, this paper suggests a feature-rich automatic translation evaluation model. Taking the human evaluation of 153 translations as the data, the automatic translation cvaluatio n model is fin ally established by in troduci ng the linear regressi on method ?
Key words: automatic translation evaluation translation quality feature linear regression
1引言
翻译标准是翻译研究的核心问题乙一,而制定一个普遍能接受的翻译标准一貞是一个难题。翻 译的白动评价技术通过量化人工翻译评价时考虑的要索,给出了一个客观、公正的翻译评价标准。 翻译的白动评价技术可以在一定穆度上推动翻译理论研究,而且对机器翻译研究也有一定的育接应 用价值。
现有的机器翻译白动评价研究屮,众多方法的基础多是以词汇为基础的字符串相似度计算方法 的改进,如BLEU方法匸、NTST方法⑵、基于编辑距离的方法⑶等等。这种以符号匹配为基础译文和 标准达案Z间的简单相似度,无法深入挖掘人丁?翻译评价屮考虑的备种语言学特征,不能满足满前 机器翻译研究以及翻译H动评价的应用需求。
木文研究H的在于利用白然语言处理技术的各种语言分析方法,探索发现翻译质量评价特征, 为建立一个能够跟人工评价接近的翻译白动评价模型奠定基础,以解决现有的机器翻译译文白动评 价在句了级和人工评测一致性较差的问题。
翻译质量特征的获取及分析
木节依次从翻译长度特征、词汇H动对齐的翻译质量特征、语言模型的翻译质量特征和白动句 法分析的翻译质量特征这四个方瓯,杳实自动获取人工评价译文是所采用的翻译质量特征。我们通 过Spearman和Pearson两种相关系数,来分析自动获取的译文特征和人I】评价结果的相关性。
2.1翻译及其人工评价数据
为了获取特征,特选取了某次外语水平考试的英汉翻译测试的试题、参考答案、153个学生翻译 答卷以及正式评分结果作为实验数据。该测试题由3个连续的句了纽.成的1段英文构成,共计76个 单词,满分12分。
由于翻译答卷是汉语,因此采用汉语分词工具,对翻译结果进行了白动分词处理。
2. 2翻译长度特征获取及分析
翻译长度特征考虑的是翻译句了的物理特征,首先取了旬了长度和平均词长。对于句了长度, 共采用了两种角度考虑:(1)从字节层面计算句子长度;(2)从词数上计算句子长度。
其屮,两种计算角度的句子长度与人T评价结果的相关性比较好,见表2?1。但平均词长与人工 评价结果几乎没有相关性,观察原始实验数据,发现汉语以2字词为主,因而所有.翻译的平均词长 都在2个汉字左右,并不随翻译结果的好坏而发生变化。
同一语言屮较长的句了通常比较短的句了携带更多的信息量,因此它常常通过携带较多信息量 的较长译文句子来表达,这样才能基木保证翻译过稈屮意义的完整性。正是基于上述的考虑,采用 概率模粮设计旬了长度参数获取了翻译长度互译概率特征。该特征与人工评价也冇较好的相关性。
表2-1翻译长度特征和人工评价的相关性
Spearman
Pearson
句长(总字节数)
0.584902
0.672936
句长(总词数)
0.541086
0.651032
文档评论(0)