- 1
- 0
- 约2.29万字
- 约 20页
- 2023-05-17 发布于四川
- 举报
本申请提供的一种文本增强处理方法、装置、设备及存储介质,包括:获取至少两个分类标签以及所述分类标签对应的文本数据,根据所述分类标签对应的文本数据的数量,确定待处理文本数据;对所述待处理文本数据进行增强处理,得到增强后的文本数据;其中,所述增强处理包括:同义词替换、随机插入词语、随机交换词语、随机删除词语中的至少一个以及对所述待处理文本数据语义处理;计算所述增强后的文本数据与所述待处理文本数据的语义相似度,得到所述语义相似度结果,根据所述语义相似度结果确定训练样本数据。采用本技术方案,能够有效提高
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114817527 A
(43)申请公布日 2022.07.29
(21)申请号 202210275130.0 G06F 40/30 (2020.01)
(22)申请日 2022.03.
原创力文档

文档评论(0)