基于CNN-BLSTM-CRF模型的生物医学命名实体识别.pdfVIP

  • 27
  • 0
  • 约2.03万字
  • 约 9页
  • 2017-10-02 发布于山东
  • 举报

基于CNN-BLSTM-CRF模型的生物医学命名实体识别.pdf

文章编号:1003-0077 (2011)00-0000-00 基于CNN-BLSTM-CRF 模型的生物医学命名实体识别* 李丽双,郭元凯 (大连理工大学计算机科学与技术学院,辽宁 大连 116023) 摘要:命名实体识别是自然语言处理任务的重要步骤。近年来,不依赖人工特征的神经网络在新闻等通用 领域命名实体识别方面表现了很好的性能。然而在生物医学领域,许多实验表明基于领域知识的人工特征 对于神经网络模型的结果影响很大。因此,如何在不依赖人工特征的情况下获得较好的生物医学命名实体 识别性能是有待解决的问题。本文提出一种基于CNN-BLSTM-CRF 的神经网络模型。首先利用卷积神经网 络(CNN )训练出单词的具有形态特征的字符级向量,并从大规模背景语料训练得到具有语义特征信息的 词向量,然后将二者进行组合作为输入,再构建适合生物医学命名实体识别的BLSTM-CRF 深层神经网络 模型。实验结果表明,不依赖任何人工特征,本文方法在Biocreative II GM 和JNLPBA2004 生物医学语料 上都达到了目前最好的结果,F-值分别为89.09%和74.40% 。 关键词:生物医学命名实体识别;词向量;LSTM; CNN ;CRF

文档评论(0)

1亿VIP精品文档

相关文档