通过强化学习生成与查询相关的文档摘要.pdfVIP

  • 1
  • 0
  • 约2.75万字
  • 约 9页
  • 2026-03-06 发布于北京
  • 举报

通过强化学习生成与查询相关的文档摘要.pdf

通过强化学习生成与查询相关的文档摘要

1112

NitinYadav,ChangsungKang,HongweiShang,MingSun

1WalmartGlobalTech,Sunnyvale,California,USA

2WalmartGlobalTech,Hoboken,NewJersey,USA

nitin.yadav@,changsung.kang@,

hongwei.shang@,ming.sun0@

Abstract

电子商务搜索引擎通常仅依赖产品标题作为有延迟限制

的排名模型的输入。然而,这种方法可能导致相关性预

测不佳,因为产品标题往往缺乏足够的细节来捕捉查询

意图。虽然产品描述提供了更丰富的信息,但其冗长和

本篇幅使其不适合实时排名,特别是对于计算密集型架构

译如交叉编码器排名模型而言。为了解决这一挑战,我们

提出了ReLSum,一个旨在生成简洁且与查询相关的商

中品描述摘要的新颖强化学习框架,该框架优化了搜索相

1关性。ReLSum利用相关性分数作为奖励来对齐总结和

v排名的目标,有效地克服了先前方法如学习目标不一致

4的局限性。该框架采用可训练的大语言模型(LLM)生图1:性能与延迟之间的权衡取决于产品上下文的大小,

0

4成摘要,这些摘要随后被用作交叉编码器排名模型的输显示了需要总结描述的需求

8入。实验结果表明,在离线指标如召回率和NDCG以及

0.在线用户参与度指标方面均取得了显著改进。ReLSum

8为大型电子商务系统提升搜索相关性提供了可扩展且高etal.2025),有时还包括一些属性如品牌、颜色和尺寸

0效的解决方案。(Voetal.2024)。

5

2仅使用产品标题作为交叉编码排名器的输入虽然

:

v介绍确保了低延迟,但通常会导致相关性预测不佳,如示

i

x现代搜索引擎通常包含两个阶段:检索和重新排例查询“taurinepowderforcats”所示,见图1。该产

r

a序。对于需要从大量文档中进行搜索的系统,检索阶段品标题,“NowFoods,Pets,CardiovascularSupportfor

使用稀疏检索方法如BM25(Robertson,Zaragozaetal.DogCats,4.5oz”,缺乏足够的细节来匹配查询意

2009)和基于双编码器的密集检索(Magnanietal.2022;图,导致相关性预测较差。添加完整的产品描述,包括

Nietal.2022;Shanetal.2023;Linetal.2024)。由于重如“WithTaurine”这样的详细信息,显著提高了相关

新排序阶段处理的文档数量比检索阶段少得多,它可以性预测。然而,由于注意力机制的二次复杂度导致高延

利用更强大的模型,如交叉编码器(Shangetal.2025),迟,在生产环境中这种方法是不切实际的,尤其是典型

与双编码器不同的是,交叉编码器可以通过注意力机制的完整产品描述通常比这个示例中的要长得多。

联合编码查询和文档。尽管交叉编码器是目前最先进机器生成的摘要为这个问题提供了一种实用的解

的排序器,但它们受限于输入标记的数量,因为变压器决方案。通过将产品描述概括为简洁的相

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档