9.21槿松-寒退之基于大模型的生成式检索.docxVIP

  • 0
  • 0
  • 约2.95千字
  • 约 26页
  • 2026-03-26 发布于浙江
  • 举报

9.21槿松-寒退之基于大模型的生成式检索.docx

基于大模型的生成式检索槿松/京东算法工程师寒退之/京东算法工程师DataFunSummit#

基于大模型的生成式检索

槿松/京东算法工程师寒退之/京东算法工程师

DataFunSummit#2024

背景/现状介绍Lexicalbase

背景/现状介绍

Lexicalbased

SemanticIDbased

未来展望

01背景/现状介绍

01

背景/现状介绍

01背景介绍召回:在一定时间和计算复杂度的约束下,从全量商品库中,快速找出与当前搜索请求潜在相关的数千商品,要求在有限资源下进行性能和效率(召回率和准确率)之间的平衡。、模型侧:匹配精准度低,尤其是中长尾query/sku用户表述与商品描述间差异较大,缺失常识等信息;给定信息下,模型交互不充分,匹配不准确。索引侧:部署成本高、推理精度损失大

01背景介绍

召回:在一定时间和计算复杂度的约束下,从全量商品库中,快速找出与当前搜索请求潜在

相关的数千商品,要求在有限资源下进行性能和效率(召回率和准确率)之间的平衡。

模型侧:匹配精准度低,尤其是中长尾query/sku

用户表述与商品描述间差异较大,缺失常识等信息;给定信息下,模型交互不充分,匹配不准确。

索引侧:部署成本高、推理精度损失大两段式的训练模式,索引损失大;

商品索引库需要天例行更新,部署、存储成本高。

两段式:

双塔+量化、联合索引优化(po

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档