- 4
- 0
- 约2.04万字
- 约 16页
- 2023-04-23 发布于四川
- 举报
本发明提供了一种语义特征提取方法,包括:获取若干类别的文本数据,其中,每一类别的文本数据均包括若干单词;计算所有文本数据中每一单词与每一类别的相关性;根据相关性从文本数据中选取部分单词作为候选词;计算预设特征词库中的预设特征词和候选词之间的互信息,其中,预设特征词库中的预设特征词用于描述文本数据的类别;根据互信息选取部分候选词加入预设特征词库中以形成类别语义词库;根据类别语义词库对文本数据进行掩码处理以得到掩码文本;根据掩码文本训练BERT模型以得到语义特征提取模型;以及将每一类别的文本数据输入
(19)中华人民共和国国家知识产权局
(12)发明专利
(10)授权公告号 CN 113971407 B
(45)授权公告日 2022.03.18
(21)申请号 202111589256.7 G06F 40/216 (2020.01)
原创力文档

文档评论(0)