VecSe组件深入学习与检索方法.pdfVIP

  • 0
  • 0
  • 约1.93万字
  • 约 12页
  • 2026-06-24 发布于北京
  • 举报

01.VectorStore组件深入学习

考虑到目前市面上的向量数据库众多,每个数据库的操作方式也无统一,但仍然存在一些

公共特征。LangChain基于这些通用的特征封装了VectorStore基类,在这个基类下,可以将

方法划分成6种:相似性搜索、最大边际相关性搜索、通用搜索、添加删除精确查找数据、检

索器、创建数据库,类图如下:

1.1带得分阈值的相似性搜索

在LangChain的相似性搜索中,无论结果多不匹配,只要向量数据库中存在数据,一定会

查找出相应的结果。在RAG应用开发中,一般是将高相似文档到Prompt中,所以可

以考虑添加一个相似性得分阈值,超过该数值的部分才等同于有相似性。

_____hold阈值参数,

在similaritysearchwithrelevancescores()函数中,可以传递scorethres

过滤低于该得分的文档。

例如没有添加阈值检索我养了一只猫,叫笨笨,示例与输出如下

importdotenv

_

fromlangchaincommunity.vectorstoresimportFAISS

_

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档