- 0
- 0
- 约1.89万字
- 约 19页
- 2023-05-23 发布于四川
- 举报
本发明涉及数据分析技术领域,揭露了一种相似文档检测方法,该方法包括:对目标文档进行分词处理,得到所述目标文档的第一分词集合;根据所述第一分词集合中分词的词频及权重确定所述目标文档的多维向量;对各历史文档进行分词处理,得到每个历史文档各自的第二分词集合;根据所述第二分词集合中分词的词频及权重确定各历史文档的多维向量;根据所述目标文档的多维向量与所述各历史文档的多维向量,确定所述目标文档与所述各历史文档的相似度,将相似度满足要求的历史文档确定为与所述目标文档相似的文档。这样,根据多维向量确定目标文档
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112163409 A
(43)申请公布日 2021.01.01
(21)申请号 202011012142.1
(22)申请日 2020.09.23
(71)申请人 平安
原创力文档

文档评论(0)