- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于BLEU格律诗生成自动评测方法研究
基于BLEU格律诗生成自动评测方法研究
内容摘要:BLEU作为当前相对具备较高应用价值的机器算法之一,在机器翻译尤其是语句生成领域存在着一定的协同发展作用。现就BLEU衡量标准在NLP领域的实际地位及发展历程,浅析基于BLEU的格律诗生成的自动评测方法研究。
关键词:BLEU NLP 机器翻译 语句生成 自动评测方法
BLEU作为NLP领域中十分经典的衡量标准,目前在多数机器语句生成技术中均存在着相应应用。早在2002年该衡量标准便得到了国外研究人员的提出,并与同年由Kishore Papineni et al.在相关学术会议中提出。这一衡量标准在实际发展过程中通过机器计算来完成对两个句子的共现词频率计算来实现对两句语句一致程度的最终测评。虽然就该自动评估方式而言容易受常用词以及较短翻译句式的影响,但不可否认其在诸如格律诗等文学类语句自动生成领域存在着较大的应用价值。现就笔者观点,对基于BLEU的格律是自动生成评测方法进行相应研究。
一.BLEU概述
在机器翻译领域BLEU技术存在着较为广泛的应用范围。由于当前机器翻译领域之中在语句生成方面的需求面日益宽广,因此在语句生成的逻辑研究以及机器算法开发方面的投入力度也随之增加。为保证语句生成的实际质量满足相应需求方的具体需求,需要在语句生成过程中做到生成思路符合人工智能的??际思路,并在具体算法设计上对语句之间的逻辑性和语言性做到良好的认知。
BLEU作为机器翻译领域中常用辅助工具的一种,其本质是指双语互译质量评估辅助工具,作用于评估机器翻译的具体质量。BLEU的设计思想与评判机器翻译好坏的思想是一致的:机器翻译结果越接近专业人工翻译的结果,则越好。众所周知,对于机器翻译实际质量的评测工作往往是由人工来完成,同时在面对多数机器翻译的实际作品时也通常存在着翻译结果与实际表达含义存在着出入的情况发生。为应对这一现象便进行了BLEU技术的开发工作。这一举措不仅实现了对于机器翻译语句质量检测的信息化渠道搭建,同时极大的节约了人工检测的成本与时间。BLEU是做不到百分百的准确的,它只能做到个大概判断,它的目标也只是给出一个快且不差自动评估解决方案,但这一结果已然体现了机器检测结果体系在机器翻译领域的应用价值。当前对于BLEU技术的开发工作仍在继续,实现BLEU算法的机器翻译检测工具同样具备了较高的应用程度,并在相关行业领域存在了一定程度的普及。
二.格律诗自动评测方法研究中BLEU技术的应用价值分析
当前现存的BLEU参与的汉语言文学作品自动生成系统中较为成功的一款便是由微软亚洲研究所自主开发研究的对联自动生成系统。由于对联在实际格式上与格律诗存在着较大的相似之处,尤其是在对仗、押韵以及各式、寓意方面的需求存在着较大的共通之处,因此在格律诗自动生成系统中同样可以应用这一体系的运行特点来在思路方面带来突破。自动对联系统在实际统计翻译理论的结合以及统计翻译理论应用的思路方面在于通过现有数字建模技术来对对联信息中的源语句、格式类型进行建模,通过较为复杂的运算进行创作格式以及创作思路的规律模拟;同时通过数字建模系统能够有效的对作品之中大多数案例中上下文之间的语义关系进行模拟,找出目标语句之间的对应关系。这一机制体现出的特点与BLEU应用价值大致吻合,且在实际应用过程中通过BLEU评测标准能够基本判断对联生成质量是否符合用户基本需求。同样的,对联自动生成系统与格律诗自动生成系统在搭建思路方面存在着较高的共通之处,为确保用户在使用格律诗自动生成系统时能够实现自身需求得到大致满足,进行BLEU标准的搭建具有着较高的应用价值。由于格律诗自动生成系统在自身系统自动评测方法上对效率及准确精度存在着较大需求,同时在诗词自动生成过程中有效避免了常用词对BLEU的实际干扰,因此该标准在格律诗的自动生成系统中存在着较为高度的发展空间,二者协同发展的实际前景具有科研价值。
三.基于BLEU的格律诗生成自动评测方法研究
作为新兴的机器算法检测的衡量标准之一,BLEU标准在实际应用过程中存在着较为明显的优缺点。其优势在于自身检测结果的应用价值显著且具备了较为高度的参考价值,同时相对于人工检测方式而言这一检测机制响应时间更短、检测效果更明显,且在多数的自动评测方法之中这一单元的应用成本要明显低于人工成本。然而同时BLEU的缺陷相对而言同样较为显著。首先,BLEU作为逻辑层面的检测响应机制在语法语义方面的应用缺失较为严重,虽然能够基本实现对于语言逻辑层面的布控,却不考虑语言表达(语法)上的准确性;其次,由于当前BLEU应用词库依旧处于填充过程之中,因此在关键词检测中虽然具备较高的精确度,但在常用词检测之中同样会受到词库匮乏这一弊端的影响,测评精度会受常用词的干扰;第三
原创力文档


文档评论(0)