- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
哈尔滨工业大学工学硕士学位论文
哈尔滨工业大学工学硕士学位论文
-II-
-II-
Abstract
The evaluation methods are a key technology which has very important significance for the machine translation research. Automatic MT evaluation metrics can play an important role in the development recycle of MT systems . Currently, many string-based metrics may evaluate the MT system output fast and simplely, but the results of the metrics have serious bias. A popular trend is combining the more linguistic informantion into the metrics; however, the linguistic informantion is at the cost of losing language independency and prevents the wide application of the linguistic motivated metrics. In fact, with more linguistic features attributed, the varieties are considered as changes of the calculation unit (or granularity) in the matching.
Focusing on how to improve the accuracy and speed of automatic evaluation metrics, and to enlarge the application-bound of them, we change their original calculation granularities of the metrics, and provide a series of effective automatic evaluation metrics.
Firstly, we propose the letter-based automatic MT evaluation metrics. The metrics are independent of the language, and slove the part of the word variation problems. In order to improve the performance of the metrics, we provided two metrics, i_letter_BLEU and i_letter_Recall. They both can automatically adjust the parameters according to references, and are more stable in performance of the letter-based metrics.
Secondly, based on features combination metrics by machine learning, the string-based metric combining multiple calculation granularities is provided. The strategy combines the features using the SVM rank and regression models. The metrics use few features through the feature selection to obtain the comparable performance with metrics competitions in last years. The underlining is that the metric does not require any deep linguistic information, and is independent of language.
At the last, we uniform the linguistic featu
您可能关注的文档
- 既有路基化学粉末除湿剂的研制与应用-道路与铁道工程专业论文.docx
- 机动车定期检验管理系统的设计和实现-软件工程专业论文.docx
- 机动车强制责任保险受害人利益保护问题研究-法律(非法学)专业论文.docx
- 机动车强制责任保险第三人利益保护问题研究-民商法学专业论文.docx
- 机动车检测预约排队系统的设计与实现-信号与信息处理专业论文.docx
- 机动车排放颗粒物在街谷中的浓度分布及减排效益评估-安全科学与工程专业论文.docx
- 机动车检验模式及规划管理分析-管理科学与工程专业论文.docx
- 机动车燃油蒸发排放特性的研究-动力机械及工程专业论文.docx
- 机动车牌照额度拍卖法律问题研究-宪法学与行政法学专业论文.docx
- 机动车第三人强制责任保险问题的研究-法学专业论文.docx
- 中国国家标准 GB 14287.5-2025电气火灾监控系统 第5部分:测量热解粒子式电气火灾监控探测器.pdf
- 《GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存》.pdf
- GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 42706.4-2025电子元器件 半导体器件长期贮存 第4部分:贮存.pdf
- 中国国家标准 GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求.pdf
- 《GB/T 19436.2-2025机械电气安全 电敏保护设备 第2部分:使用有源光电保护装置(AOPDs)设备的特殊要求》.pdf
- 《GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备》.pdf
- GB 27898.4-2025固定消防给水设备 第4部分:消防气体顶压给水设备.pdf
- GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
- 中国国家标准 GB/T 31270.1-2025化学农药环境安全评价试验准则 第1部分:土壤代谢试验.pdf
最近下载
- 04国家级精品课程 乒乓球教学课件 第四章 乒乓球战术.ppt VIP
- 某某太阳能发电有限公司电力线路穿越项目安全评价.doc VIP
- 冷却塔维护保养方案.docx VIP
- 中医病历书写基本规范.pptx VIP
- 约克离心式冷水机组_说明书.pdf VIP
- 外国人体格检查记录-StudyinChina,experienceinChina.doc VIP
- 小天使 乐器配件 电子节拍器 WSM-288 使用说明.pdf
- 2025年政务服务办事员(三级)每日一练标准题库200题(含答案).docx
- 03国家级课程 乒乓球教学课件 乒乓球技术.ppt VIP
- 中期论文化工设计-年产3万吨甲基丙烯酸甲酯分厂设计.doc VIP
原创力文档


文档评论(0)