程童-作业帮检索系统重构:Havenask 实践案例分享.pdfVIP

程童-作业帮检索系统重构:Havenask 实践案例分享.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

作业帮检索系统重构:

Havenask实践案例分享

程童

Havenask(HA3)

01结果很重要

02业务场景及核心问题

目录03思路和决策

04实践过程

05总结

01

结果很重要

成本问题

单位成本

s

p

q

/

20212022202320242025

注:统计时间节点为每年年末高峰,年取元旦后数值

索引容量瓶颈

业务需求问题

结果很重要

大规模复杂算法系统年省23年全年有效索引数据强化向量检索,快速支持

成本40%+增加超过100%,索引成基于RAG及多模态大模型

本增长10%的AI业务落地

结果很重要

十年系统能力重塑,拥抱AI时代

02

业务场景及核心问题

一次典型的题目检索过程

拍照上传图像图像预处理检测识别

一次典型的题目检索过程

检索query生成召回排序返回top结果

真实业务场景的复杂性

智能批改检索增强及多模态LLM能力

技术能力拆解

题目检索图形题检索多分类批改……全学科知识点检索检索增强多模态LLM

OCRAI

/

系统架构

检索系统的挑战

1.压力主要集中在索引引擎上

2.其次是排序层的问题

3.根因还是流量数据量持续增长,考验系统性能

03

思路和决策

思路与决策

1.

2.

约束

3.

现有基础迭代自研替换开源替换

✓✓

优势

✓✓

文档评论(0)

150****8957 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档