一种结合词向量多特征融合的新词发现方法.pdfVIP

  • 1
  • 0
  • 约1.74万字
  • 约 12页
  • 2023-05-05 发布于四川
  • 举报

一种结合词向量多特征融合的新词发现方法.pdf

本发明公开了一种结合词向量多特征融合的新词发现方法,该方法步骤包括:对语料进行特征标注,计算属性对互信息矩阵和自信息矩阵,计算候选特征属性对得分;聚类词向量,找到对应的最近邻类中心向量,并找出该类中心向量对应的词作为词向量特征属性,遍历所有词向量特征属性对,计算词向量特征属性对自信息矩阵和互信息矩阵,计算所有词向量特征属性对得分;对所有候选特征属性对得分配置优化权重系数后求和计算总得分;总得分超过新词阈值时提取候选词对对应得分向量到样本集合;更新权重系数并迭代训练至损失函数收敛获得最终的权重系数

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 114298029 A (43)申请公布日 2022.04.08 (21)申请号 202111523723.6 G06K 9/62 (2022.01)

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档