- 1
- 0
- 约1.28万字
- 约 11页
- 2023-06-07 发布于四川
- 举报
本发明属于命名实体识别技术领域,具体涉及一种四险一金领域政策法规文本实体识别方法。本发明通过预训练语言模型BERT得到每个字符基于上下文特征动态生成的具有上下文语义信息的字向量,通过word2vec中的skip‑gram模型得到每个词语的词向量,将具有上下文语义信息的字向量和其所在的词的词向量利用维度拼接的方式进行特征融合,得到联合字词向量,不仅可以弥补少量标注样本特征不足和字符语义提取不充分的问题,还为字向量补充了词级短语信息,从而在一定程度上提高模型的准确率。本发明可以有效解决四险一金领域命
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112836046 A
(43)申请公布日 2021.05.25
(21)申请号 202110039836.2
(22)申请日 2021.01.13
(71)申请人 哈尔
原创力文档

文档评论(0)