- 2
- 0
- 约3.45万字
- 约 26页
- 2023-06-05 发布于四川
- 举报
本申请案涉及文本分类器训练数据的产生。一种方法包含:接收指定文档语料库的文档中的所关注术语的输入,及确定代表目标词组的目标上下文嵌入,所述目标词组包含所述所关注术语及位于所述文档中靠近所述所关注术语的上下文词。所述方法还包含从所述文档语料库当中标识在语义上类似于所述目标词组的第一候选词组及在语义上不类似于所述目标词组的第二候选词组。所述方法进一步包含接收用户输入,所述用户输入将所述第一候选词组的至少一部分标识为与第一标记相关联,并将所述第二候选词组的至少一部分标识为未与所述第一标记相关联。所述方
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112749547 A
(43)申请公布日
2021.05.04
(21)申请号 20201
原创力文档

文档评论(0)