10.27已改_中文结合卷积和长短期记忆网络的长文分类方法.pdfVIP

  • 10
  • 0
  • 约2.12万字
  • 约 6页
  • 2022-05-09 发布于北京
  • 举报

10.27已改_中文结合卷积和长短期记忆网络的长文分类方法.pdf

结合卷积和长短期记忆网络的长文分类方法 1 2 1 1 1 姜恬静 和欣 何军 冯姣 1 (南京信息工程大学电子与信息 ,江苏 南京 210044) 2 (军事 系统工程 ,北京 100039) :2017221 摘要:现如今互联网成为了 信息的主要平台,人们使用 在海量的文档中快速获取想要的信息。 这要求 文献有明确的分类和 。传统的文献分类方法通常提取 或关键句,利用文本的局部信息 进行分析,对于方向相似的科技 ,传统的局部分析的方法区分度不高,分类不够明确易产生 。本文 提出了一种对文献进行全局分析,自动生成 的长文分类方法。为了降低卷积神经网络(Convolutional Neural Network, )的深度,同时通过遍历全文捕获全局信息,本文提出了随机抽样算法将文献拆分为 多个部分。然后,结合卷积神经网络和长短期记忆网络(Long Short-Term Memory,LSTM),提取各部分 的局部特征,记忆各部分特征的相关性,得出分类结果。实验结果表明,与基于局部分析的文本分类方法 相比,本文提出的长文分类方法能够更准确地区分方向相似的长文文献。 :自然语言处理 长文本分类 随机抽样 特征提取 卷积长短期记忆网络 中图法分类号:TP391.1 文献标识码:A Convolutional Long Short-Term Memory for long length document classification JIANG Tian-jing 1 YE Xin2 HE Jun1 FENG Jiao1 LI Peng1 1 (Nanjing university of information science and technology, College of Electronic and Information Engineering,Nanjing 210044, ) 2 (Institute of System Engineering, Academy of Military Sciences PLA, 100039, ) Abstract :The Internet has e an important platform for disseminating information. It is necessary to quickly extract desired information from substantial documents based on the keywords. This method requires clear classification and labelling of papers. Traditional document classification methods analyze texts by extracting keywords or key sentences, especially for scientific papers in similar directions. Based on the partial information, the classification is not clear enough to cause confusion. In this paper, we propose a method for analyzing the long documents and for automatically generating their labels in terms of the global information. In order to reduce the depth of the convolutional neural network ( ) and to capture the global information, the proposed classification method firs

文档评论(0)

1亿VIP精品文档

相关文档