- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Milvus百亿级向量数据库的探索
演讲人:刘力
DTC2024年数据技术嘉年华(公开)PPT
目录
CONTENTS▶什么是向量数据库
从向量检索到Milvus
DTC2024年数据技术嘉年华(公开)PPT
不仅仅是ANN搜索
ZillizCloud及更多
什么是向量数据库
向量检索是非结构化数据处理的范式,解决传统数据库无法
做到基于语义查询,跨模态查询的问题
向量数据库是一种专为存储和查询高维度向量数据而优化的
数据库系统。
DTC2024年数据技术嘉年华(公开)PPT
向量数据的场景
DTC2024年数据技术嘉年华(公开)PPT
RetrievalAugmentedGeneration(RAG)
通过语义检索提高生成式模型
的可用性
•提高准确性和相关性
•提供私有/特定领域的知识
DTC2024年数据技术嘉年华(公开)PPT
•提升知识的实时性
•消除幻觉
Milvus:全球第一款向量数据库
DTC2024年数据技术嘉年华(公开)PPT
目录
CONTENTS什么是向量数据库
▶从向量检索到Milvus
DTC2024年数据技术嘉年华(公开)PPT
不仅仅是ANN搜索
ZillizCloud及更多
向量数据库的基石:向量索引
IVF,SCANN,…
ANNS:ApproximateNearest
基于桶的ANN算法
NeighborSearch
HNSW,DiskANN,…
基于图的ANN算法
DTC2024年数据技术嘉年华(公开)PPT
利用预先插入的数据获取数据分布
利用Graph,聚类,Hash等方式快
速筛选并接近目标位置
利用SQ,PQ量化和SIMD降低单次距
离的成本
为什么需要向量数据库
您可能关注的文档
- AntDB融合数据库实时流数据处理引擎揭秘.pdf
- ByConity的架构与设计:从ClickHouse到云原生.pdf
- Data Lakehouse:你的下一个数据仓库.pdf
- DBdoctor:利用eBPF技术实现数据库智能诊断与优化.pdf
- ETL VS ELT:企业数据中台构建的更优选择是什么.pdf
- Gen AI 时代趋势中的 TiDB.pdf
- KubeBlocks 把所有数据库运行到K8s上.pdf
- MogDB Cube数据库一体机架构解析与创新实践.pdf
- NineData数据复制技术原理与实践 跨云10000公里实时数据复制.pdf
- openGauss架构创新与产品能力解读 -贺承汉.pdf
- 大学生信息技术-拓展模块 课件 项目12 区块链概述 任务3.pptx
- 大学生信息技术-拓展模块 课件 项目12 区块链概述 任务4.pptx
- 大学生信息技术-拓展模块 课件 项目7 云计算 任务3 云计算技术.pptx
- 大学生信息技术-拓展模块 课件 项目4 程序设计基础 任务3 程序设计方法和实践.pptx
- 大学生信息技术-拓展模块 课件 项目8 通信技术 任务1 现代通信技术基础.pptx
- 大学生信息技术-拓展模块 课件 项目1任务1 计算机系统信息安全.pptx
- 大学生信息技术-拓展模块 课件 项目6 人工智能 任务1 人工智能简介.pptx
- 大学生信息技术-拓展模块 课件 项目6 人工智能 任务3 ChatGPT简介.pptx
- 大学生信息技术-拓展模块 课件 项目4 程序设计基础 任务2 程序设计的思想.pptx
- 大学生信息技术-拓展模块 课件 项目13 区块链技术 任务1.pptx
文档评论(0)