局部敏感哈希精要
局部敏感哈希(Locality-Sensitive Hashing, LSH)
1 Introduction
局部敏感哈希(Locality-Sensitive Hashing, LSH)是一种用于海量高维数据的近似最近邻快速查找技术,本文内容包括了LSH的原理、LSH哈希函数集、以及LSH的一些参考资料。
2 局部敏感哈希(LSH)
面对海量且高维的数据,怎样快速地从海量的高维数据集合中找到与某个数据最相似(距离最近)的一个数据或多个数据成为了一个难点和问题。如果是低维的小数据集,我们通过线性查找(Linear Search)就可以容易解决,但如果是对一个海量的高维数据集采用线性查找匹配的话,会非常耗时。因此,我们需要采用一些类似索引的技术来加快查找过程,通常这类技术称为最近邻查找(Nearest Neighbor, AN),例如K-d tree;或近似最近邻查找(Approximate Nearest Neighbor, ANN),例如K-d tree with BBF, Randomized K-d trees, Hierarchical K-means Tree。而LSH是ANN中的一类方法。
我们知道,通过建立Hash Table的方式我们能够得到的查找时间性能,其中关键在于选取一个hash function,将原始数据映射到相对应的桶内(bucket, hash b
您可能关注的文档
最近下载
- 海上深水港口码头工程施工组织设计.docx VIP
- 2026年入团积极分子培训结业考试题库及答案(共100题).docx VIP
- 2025届福建省厦门市思明区小学二年级上学期期中语文试题.docx
- 国家奖励办登记备案地社会力量设立科学技术奖项清单.doc VIP
- 北京理工大学超星尔雅学习通“会计学”《会计信息系统》网课试题附带答案.docx VIP
- 2023中国铁建股份有限公司所属单位笔试备考题库及答案解析.docx VIP
- 2026 年广西普通高等教育专升本考试(含高职升本)新大纲 医药卫生大类 专业基础综合课合卷 第 8 套模拟考试试卷(含答案解析).pdf VIP
- 第七章建设工程监理质量控制.pptx VIP
- 人教版数学五年级下册全册课件(2025年4月修订).ppt
- 道路改造工程施工方案.().doc VIP
原创力文档

文档评论(0)