文本聚类方法及装置.pdfVIP

  • 0
  • 0
  • 约1.63万字
  • 约 14页
  • 2023-06-03 发布于四川
  • 举报
本发明提供一种文本聚类方法及装置,该方法包括:对每个待聚类文本进行分词,将每个待聚类文本中的词语转换为词向量;将每个待聚类文本中所有词语的词向量进行融合,将融合结果作为每个待聚类文本的文档向量;根据所述待聚类文本的文档向量,计算任意两个待聚类文本之间的相似度,若任意两个待聚类文本之间的相似度大于预设阈值,则将所述任意两个待聚类文本作为一类,若任意两类中存在相同的待聚类文本,则将所述任意两类中的待聚类文本归为一类。本发明实现不仅可以最大限度地将相似度低的待聚类文本分离,使得聚类结果更加准确,还可以

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112632229 A (43)申请公布日 2021.04.09 (21)申请号 202011612359.6 G06F 40/284 (2020.01)

文档评论(0)

1亿VIP精品文档

相关文档