一种基于词典生成词向量的方法及系统.pdfVIP

  • 4
  • 0
  • 约1.25万字
  • 约 11页
  • 2023-05-23 发布于四川
  • 举报

一种基于词典生成词向量的方法及系统.pdf

本发明涉及一种基于词典生成词向量的方法及系统,包括:将词典包含的词汇构成词汇集合,统计所述词汇集合中各词汇在所述词典包含的词汇释义中出现的频率,根据所述频率对各词汇释义进行分词,得到释义词汇序列;以所述词汇为节点,根据各词汇及释义词汇序列的对应关系,对各节点进行连接,构成有向边,并确定各有向边的权重,得到基于词典的有向图;基于深度游走算法对所述有向图进行计算,得到词向量。本发明将词典提供的词汇信息融合进词向量,能够为词向量训练提供优质的数据基础,进而更好地对词义进行挖掘、支撑自然语言处理任务。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 112163422 A (43)申请公布日 2021.01.01 (21)申请号 202011020617.1 (22)申请日 2020.09.25 (71)申请人 和美(深圳)信息技术股份有限公司

文档评论(0)

1亿VIP精品文档

相关文档