- 0
- 0
- 约1.63万字
- 约 14页
- 2023-06-03 发布于四川
- 举报
本发明提供一种文本聚类方法及装置,该方法包括:对每个待聚类文本进行分词,将每个待聚类文本中的词语转换为词向量;将每个待聚类文本中所有词语的词向量进行融合,将融合结果作为每个待聚类文本的文档向量;根据所述待聚类文本的文档向量,计算任意两个待聚类文本之间的相似度,若任意两个待聚类文本之间的相似度大于预设阈值,则将所述任意两个待聚类文本作为一类,若任意两类中存在相同的待聚类文本,则将所述任意两类中的待聚类文本归为一类。本发明实现不仅可以最大限度地将相似度低的待聚类文本分离,使得聚类结果更加准确,还可以
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112632229 A
(43)申请公布日 2021.04.09
(21)申请号 202011612359.6 G06F 40/284 (2020.01)
您可能关注的文档
最近下载
- 金属非金属地下开采矿山风险分级管控体系.doc VIP
- 光缆路由检测仪3m2273e施工维护解英决方案.ppt VIP
- 安全风险辨识分级管控体系文件全套.doc VIP
- L13J5-1平屋面-标准图集.pdf VIP
- (2026年)胸腔镜下交感神经切断术手术配合PPT课件.pptx VIP
- 广东省深圳市宝安区松岗中学2024-2025学年七年级下学期历史期中调研试卷(含答案).pdf VIP
- 防洪防汛的主题班会.ppt VIP
- 05S502阀门井图集完整版.pdf VIP
- JBT 9229-2024《剪叉式升降工作平台》.pdf VIP
- 小升初20次课 第13次课(N开头重点词汇 一般将来时 听力训练).docx VIP
原创力文档

文档评论(0)