CN112989170B 应用于信息搜索的关键词匹配方法、信息搜索方法及装置 (北京百度网讯科技有限公司).docxVIP

  • 0
  • 0
  • 约2.41万字
  • 约 43页
  • 2026-01-19 发布于重庆
  • 举报

CN112989170B 应用于信息搜索的关键词匹配方法、信息搜索方法及装置 (北京百度网讯科技有限公司).docx

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN112989170B(45)授权公告日2025.07.08

(21)申请号202110315277.3

(22)申请日2021.03.24

(65)同一申请的已公布的文献号申请公布号CN112989170A

(43)申请公布日2021.06.18

(73)专利权人北京百度网讯科技有限公司

地址100085北京市海淀区上地十街10号

百度大厦2层

(72)发明人陆军旭连义江

(74)专利代理机构北京同立钧成知识产权代理有限公司11205

专利代理师张芳黄健

(51)Int.CI.

GO6F16/9532(2019.01)

GO6F16/334(2025.01)

GO6F40/30(2020.01)

GO6F17/16(2006.01)

(56)对比文件

CN110162593A,2019.08.23CN111046299A,2020.04.21审查员李孟爽

权利要求书3页说明书13页附图6页

(54)发明名称

应用于信息搜索的关键词匹配方法、信息搜索方法及装置

(57)摘要

CN112989170B本申请公开了一种应用于信息搜索的关键词匹配方法、信息搜索方法及装置,涉及人工智能中的大数据和智能搜索。包括:获取样本数据,并根据样本数据确定邻接矩阵,其中,样本数据包括具有点击关系的各搜索词与各关键词,邻接矩阵表征样本数据中的各词之间的点击关系的矩阵,对邻接矩阵进行降维处理,得到搜索词与关键词之间的匹配关系,其中,匹配关系用于对待搜索词进行关键词的搜索匹配,使得确定出的匹配关系可以相对较为准确地表征各搜索词和各关键词之间的对应关系,即能使得针对任一搜

CN112989170B

获取样本数据

根据样本数据确定邻接矩阵

对邻接矩阵进行降维处理,得到搜索词与关键词之间的匹配关系

S101

S102

S103

CN112989170B权利要求书1/3页

2

1.一种应用于信息搜索的关键词匹配方法,包括:

获取样本数据,并根据所述样本数据确定邻接矩阵,其中,所述样本数据包括具有点击关系的各搜索词与各关键词,所述邻接矩阵表征所述样本数据中的各词之间的点击关系的矩阵,所述样本数据是经过过滤处理后的数据,所述过滤处理包括对重复的词以及对不具有通用性的词的过滤;

随机生成高斯分布矩阵,对所述高斯分布矩阵进行正交化处理,得到正交矩阵;

基于所述正交矩阵对所述邻接矩阵进行降维处理,得到向量文本;

根据所述向量文本中的每一搜索词向量、以及每一关键词向量,生成搜索词与关键词之间的匹配关系;

其中,所述匹配关系用于对待搜索词进行关键词的搜索匹配;

其中,根据所述样本数据确定邻接矩阵,包括:

根据所述样本数据构建无向图,并根据所述无向图和所述无向图中各个边的权重生成所述邻接矩阵,所述边的权重通过具有所述点击关系的搜索词和关键词之间的点击次数表

征;

所述根据所述向量文本中的每一搜索词向量、以及每一关键词向量,生成搜索词与关键词之间的匹配关系,包括:

根据所述无向图中各个节点的节点类型,将所述向量文本拆分为搜索词向量文本和关键词向量文本,所述节点类型包括搜索词的节点类型和关键词的节点类型;

确定所述搜索词向量文本中的每一搜索词向量,与所述关键词向量文本中的每一关键词向量之间的相似信息;

针对任一搜索词,基于预设数量,从与所述任一搜索词对应的各相似信息中,依次选择相似信息最大的关键词向量对应的关键词,并确定选择出的关键词中的每一关键词的召回率,并将召回率大于预设召回率阈值的关键词确定为与任一搜索词存在匹配关系的关键

词。

2.根据权利要求1所述的方法,其中,所述无向图包括多个节点和多条边,一个节点对应一个搜索词或者一个关键词,任一两节点之间的边对应点击关系,所述邻接矩阵表征所述无向图中各节点之间的点击关系的矩阵。

3.一种信息搜索方法,包括:

接收搜索请求,其中,所述搜索请求中携带待搜索词;

根据匹配关系确定与所述待搜索词对应的目标关键词,其中,所述匹配关系是基于如权利要求1或2所述的方法生成的;

基于所述目标关键词进行信息搜索,得到并输出与所述目标关键词对应的搜索结果。

4.根据权利要求3所述的方法,其中,所述匹配关系是基于正交矩阵对邻接矩阵进行降维处理生成的。

5.根据权利要求3或4所述的方法,其中,从匹配关系中确定与

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档