- 4
- 0
- 约1.25万字
- 约 11页
- 2023-05-23 发布于四川
- 举报
本发明涉及一种基于词典生成词向量的方法及系统,包括:将词典包含的词汇构成词汇集合,统计所述词汇集合中各词汇在所述词典包含的词汇释义中出现的频率,根据所述频率对各词汇释义进行分词,得到释义词汇序列;以所述词汇为节点,根据各词汇及释义词汇序列的对应关系,对各节点进行连接,构成有向边,并确定各有向边的权重,得到基于词典的有向图;基于深度游走算法对所述有向图进行计算,得到词向量。本发明将词典提供的词汇信息融合进词向量,能够为词向量训练提供优质的数据基础,进而更好地对词义进行挖掘、支撑自然语言处理任务。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112163422 A
(43)申请公布日 2021.01.01
(21)申请号 202011020617.1
(22)申请日 2020.09.25
(71)申请人 和美(深圳)信息技术股份有限公司
您可能关注的文档
最近下载
- 2025年6月福建省高中学业水平合格性考试(会考)生物试题(含答案解析).docx VIP
- 2026年山西初中学业水平测试靶向模考试卷(二)语文(真题含答案解析).docx VIP
- 光伏发电组件负离子除尘装置及除尘方法.pdf VIP
- 【生物】期末复习课件-2025-2026学年-人教版初中生物八年级下册.pptx VIP
- 象棋社团活动计划及活动教案.docx VIP
- 血透患者阶段小结.xls VIP
- (2003年全国高考物理试题附答案.doc VIP
- 资料课件文稿分析ciba lanaset dyeing system for wool.pdf VIP
- 2002年普通高等学校招生全国统一考试(全国卷.理科综合)高考物理试卷(含答案).pdf VIP
- 电梯修理施工方案.docx VIP
原创力文档

文档评论(0)