基于序列到序列模型的法律问题关键词抽取.PDFVIP

  • 16
  • 0
  • 约2.7万字
  • 约 7页
  • 2018-10-26 发布于山东
  • 举报

基于序列到序列模型的法律问题关键词抽取.PDF

基于序列到序列模型的法律问题关键词抽取.PDF

第 ** 卷 第 * 期 中文信息学报 Vol. ** ,No. * 201* 年 * 月 JOURNAL OF CHINESE INFORMATION PROCESSING ***. ,201* 文章编号:1003-0077 (2017)00-0000-00 基于序列到序列模型的法律问题关键词抽取 1,2 1,2 1,2 1,2 3 3 曾道建 ,童国维 ,戴愿 ,李峰 ,韩冰 ,谢松县 (1.长沙理工大学 计算机与通信工程学院,湖南 长沙 410114 ; 2.长沙理工大学 综合交通运输大数据智能处理湖南省重点实验室,湖南 长沙 410114; 3. 湖南数定智能科技有限公司,湖南 长沙 410013) 摘要:传统的关键词抽取算法不能够抽取那些没有在文本当中出现过的关键词,因此传统的关键词抽取算法在抽 取法律问题(短文本)的关键词任务上效果不佳。本文提出了一种基于强化学习的序列到序列(seq2seq)模型从法律 问题中抽取关键词。首先,编码器将给定法律问题文本的语义信息压入一个密集矢量;然后,解码器自动生成关键词。 因为在关键词抽取任务中,生成的关键词的前后顺序无关紧要,所以引入强化学习来训练我们的模型。所提出的模型 结合了强化学习在决策上的优势和序列到序列模型在长期记忆方面的优势,在真实数据集上的实验结果表明,带有强 化学习的序列到序列模型在关键词抽取任务上有较好的实验效果。 关键词:关键词抽取;序列到序列模型;强化学习 中图分类号:TP391 文献标识码:A Keyphrase extraction for legal questions based on sequence to sequence model 1,2 1,2 1,2 1,2 3 3 Daojian Zeng ,Guowei Tong ,Yuan Dai ,Feng Li ,Bing Han ,Songxian Xie (1. School of Computer and Communication Engineering ,Changsha University of Science and Technology , Changsha ,Hunan 410114 ,China ; 2. Hunan Provincial Key Laboratory of Intelligent Processing of Big Data on Transportation , Changsha University of Science and Technology ,Changsha ,Hunan 410114 ,China ; 3.Hunan Date-driven AI Technology Co. Ltd. ,Changsha ,Hunan 410114 ,China) Abstract : Traditional keyphrase extraction algorithms cannot extract keyphrases that have not appeared in the text. Ther e- fore, traditional algorithms perform poorly on the task of extracting keyphrases

文档评论(0)

1亿VIP精品文档

相关文档