基于文本特征增强的电力命名实体识别.pdfVIP

  • 29
  • 0
  • 约3.88万字
  • 约 9页
  • 2023-09-28 发布于湖北
  • 举报

基于文本特征增强的电力命名实体识别.pdf

第46 卷 第21 期 2022 年11 月10 日 Vol.46No.21 Nov.10,2022 DOI:10.7500/AEPS20210323003 基于文本特征增强的电力命名实体识别 1 1 1,2 1 1 1 刘文松 ,胡竹青 ,张锦辉 ,刘雪菁 ,林 峰 ,俞 俊 (1. 南瑞集团有限公司(国网电力科学研究院有限公司),江苏省南京市 211106; 2. 江苏瑞中数据股份有限公司,江苏省南京市 211106) 摘要:针对电力领域语料规模小、实体嵌套、实体缩写等特点,提出基于文本特征增强的实体识别 方法。首先,通过预设词库和低粒度分词的方式,在合理利用中文单词蕴含的语义信息的同时,降 低分词传递误差的影响。其次,设计词级双向门控循环单元学习中文单词构造特征,融合词性和词 长特征后,与单词向量拼接成为单词增强向量。然后,基于双向门控循环单元-注意力机制-条件随 机场完成实体识别模型的构建和训练。在此基础上,采用

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档