- 0
- 0
- 约9.77千字
- 约 9页
- 2023-04-26 发布于四川
- 举报
本发明公开了一种海量文件相似计算方法及装置,获取所有要计算相似度的文本所对应的SIMHASH;将所有SIMHASH分为n份,将每一份作为key把完整的SIMHASH作为值存入Set集合中;将所述Set集合作为值存入到HashMap中;再次遍历所有SIMHAS,将遍历到的每个SIMHASH分成n份;将遍历后分成的n份SIMHASH段分别放到Map中查找是否有相同;若有相同,则可能存在与其相似的SIMHASH;获取Map中的值再逐一比较是否有满足相似条件的SIMHASH;本发明提供的海量文件相似计算
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 114090741 A
(43)申请公布日 2022.02.25
(21)申请号 202111407548.4
(22)申请日 2021.11.24
(71)申请人 北京鼎普科技股份有限公司
您可能关注的文档
最近下载
- 中建项目移动式操作平台施工方案范本.docx VIP
- 项目移动式操作平台施工方案.pdf VIP
- 交际教学法在初中英语教学中的实践与创新:理论、策略与案例分析.docx VIP
- Q/GDW-1355-2013单相智能电能表形式规范.pdf VIP
- 2026五年级数学上册 多边形面积的文化传承.pptx VIP
- 2025年公共营养师三级理论知识及技能真题含答案.docx VIP
- GB51158-2015 通信线路工程设计规范.docx
- 数学建模视角下的概率与数列相结合问题课件-2025届高三数学二轮复习.pptx VIP
- 服装面料知识与成本核算培训课件.ppt VIP
- Q/GDW10356-2024三相智能电能型式规范.pptx VIP
原创力文档

文档评论(0)