- 4
- 0
- 约1.71万字
- 约 18页
- 2023-04-26 发布于四川
- 举报
本发明公开了一种多任务中文实体命名识别方法,包括以下步骤:(1)首先对数据进行预处理,划分数据集并进行标注任务设置;(2)通过BERT对输入的主任务数据和辅任务进行特征抽取;(3)对于主任务和辅任务分别采用双层的包括输入、隐藏和输出的LSTM神经网络模型对词向量进行分类训练;(4)将辅任务和主任务的训练好的隐藏层信息经过注意力机制层进行全连接(5)最后经过CRF层考虑了序列中的全局标签信息,输出最优的标签序列;(6)通过验证集对训练好的模型进行性能评估。本发明能够帮助研究者在海量的中文文本数据中
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114091460 A
(43)申请公布日 2022.02.25
(21)申请号 202111405790.8
(22)申请日 2021.11.24
(71)申请人 长沙
原创力文档

文档评论(0)