- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国外言行为自动标注研究进展
国外言语行为自动标注研究进展 〔摘要〕文章采用统计方法考察了近十年在国外期刊上与言语行为自动标注相关的论文,进而呈现国外言语行为自动标注研究的进展。近十年言语行为自动标注以言语行为理论为基础,对文本、音频等言语行为进行标注,热点话题主要为情感识别、文本挖掘、人机对话、机器翻译等,研究体裁也多集中于医疗对话、商务会议、信函、网络语言等。文章对国内未来言语行为自动标注研究有一定的启示意义。 中国论文网 /4/viewhtm 〔关键词〕言语行为;自动标注;标注体系 〔中图分类号〕H0〔文献标识码〕A〔文章编号〕1008-2689(2017)05-0012-07 引 言 英国哲学家Austin在20世纪50年代提出的言语行为理论(speech act theory)认为人们在以言行事,人们说话的同时是在实施某种行为[1]。Austin 指出言语行为可以分为叙事行为、施事行为和取效行为三种。言语行为自动标注是指“使用计算机等技术使言语行为分类的工作自动化,有时也被称为言语行为自动识别或自动分类等”[2]。言语行为自动标注对于对话系统、机器翻译和自动问答系统中问题理解和意图判断具有重要的意义,已成为信息检索和自然语言处理领域的一个研究热点。言语行为标注体系及其自动识别的应用主要集中在对话系统、机器翻译和自动问答系统等方面[3]。虽然已有学者提及相关术语“言语行为自动标注”[4],或对言语行为自动标注进行综述研究,但至今还未见考察国外言语行为自动标注研究最新进展的相关文章。文章拟考察近十年(2007-2016)发表在国际期刊上的论文,以期呈?F国外言语行为自动标注研究进展。 一、 研究问题与方法 本研究将回答以下问题:(1)近十年国外言语行为自动标注研究的主要标注体系是什么?(2)近十年国外言语行为自动标注的热点研究体裁、研究话题是什么?首先,本研究以“speech act automatic annotation”为检索词,选取 SSCI 来源期刊中的语言学期刊和计算机科学期刊,时间设置为 2007-2016年,共获得100篇相关英文文献。为保证结果的可靠性,筛选过程由两位研究者分别进行并汇总核对。其次,对文献的关键词频数进行人工统计,并得出关键词统计表。最后,本研究基于关键词词频统计数据,挖掘近十年国外言语行为自动标注的研究热点,包括标注体系、研究体裁和研究话题。 二、 言语行为标注体系 在进行言语行为自动标注时,研究者最常用到的标注体系是DAMSL标注体系,其他常见的有DIMEDAMSL、INTSINT、VERBMOBIL标注体系。 (一) DAMSL标注体系 计算机自动标注系统建立在Austin和Searle的言语行为理论之上,同时推动了言语行为理论的发展[1]。对话行为多层置标语言体系(Dialogue Act Markup in Several Layers,简称DAMSL)。主要针对对话行为的信息标注,标注分为四个层次:(1)交流状况(Communicative Status)记录对话是否可以理解并且完整,包括不可译(Uninterpretable)、中断(Abandoned)和自言自语(Selftalking);(2)信息层次(Information Level)指对话内容中包含的语义类别,包括任务(Task)、任务管理(Taskmanagement)、交流管理(Communicationmanagement)及其他层次(Otherlevel)四个标签;(3)前向功能(Forwardlooking Function)指当前对话对说话者未来的信念和行动带来的限制,包括声明(Statement)、对听话者未来行动有影响的(Influencingaddreseefutureaction)、信息询问(Inforequest)、承诺(Committingspeakerfutureaction)等标签;(4)后向功能(Backwardlooking Function)指当前对话与之前对话的联系,包括同意(Agreement)、理解(Understanding)、回答(Answer)三类标签[5]。每段对话都可被标记为四种层次中的0个、1个或多个标签。 在针对不同体裁中的不同言语行为进行标记时,研究者会对标签进行更细致的归类和筛选,如在网络即时通讯对话中,SelfTalk(自言自语)和Uninterpretable(不可译的)两个标签因不符合对话形式而被排除,No Answers (没有回应)、Rejects(拒绝)和Negative Nonno Answers都显示为No Answer。 DAMSL体系应用最为广泛,多用于会话分析,如在Rosset、Tribout和La
文档评论(0)