- 0
- 0
- 约1.54万字
- 约 13页
- 2023-07-05 发布于四川
- 举报
本公开提供了一种文本内容异常检测方法、装置以及存储介质,涉及计算机技术领域,其中的方法包括:使用相似度概率模型获取词语之间的相似度概率值,生成词语相似度概率信息;获取与采集的每条文本相对应的特征词,并计算特征词的TF‑IDF值;根据词语相似度概率信息获取两个特征向量的特征词之间的特征词相似度概率值,并基于特征词相似度概率值以及TF‑IDF值计算两个特征向量之间的距离;使用聚类算法并根据距离对多个特征向量进行聚类处理,基于聚类处理结果确定出现异常的文本。本公开的方法、装置以及存储介质,在异常检测中
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 113807073 A
(43)申请公布日
2021.12.17
(21)申请号 20201
原创力文档

文档评论(0)