- 0
- 0
- 约1.24千字
- 约 2页
- 2026-06-24 发布于北京
- 举报
《113_数据块与布隆过滤器块分析》
数据块和布隆过滤器块
数据块中包含许多键值对,每个键值对包含了键长度、值长度、键、值。键是一个复杂的
结构,实际上包含了行键长度、行键、列族长度、列族、列限定符、时间戳、键类型。
键类型有几种类型:put、delete、deleteColumn、deleteFamily。
获取键
数据时需要遍历大量的HFile,布隆过滤器可以快速过滤出哪些HFile肯定没有所需
数据,从而避免不必要的,大大减少需要的HFile数量。布隆过滤器都在内
存中,性能非常高。
这个布隆过滤器的工作原理是这样的:每个hfile都有一个位数组,key通过多个哈希函数
映射,将对应的位置设置为1。当获取key时,同样使用多个哈希函数进行映射,如果数
组中的某个位置是0,则可以确定该key不在这个hfile中;如果位置是1,则可能存在。
如果hfile很大,那么位数组也会非常大,无法全部加载到内存中。
因此,位数组会被拆分成多个部分,每个部分的key使用一个位数组。一个hfile可能包
含多个位数组,在进行key查询时,首先定位到对应的位数组,然后将其加载到内存中,
执行过滤逻辑。hfile中的每个布隆块就是一个位数组。
《113_DataBlock与布隆过滤器Block分析》
datablock和布隆过
您可能关注的文档
最近下载
- 年产5万吨甲基叔丁基醚(MTBE)生产工艺说明书-必读.doc VIP
- 2025年大学《工程管理-工程管理概论》考试参考题库及答案解析.docx VIP
- 小讲课老年痴呆症.pptx VIP
- 年产2000万支曲普瑞林微球冻干制剂的GMP车间工艺设计.doc VIP
- 2026年深圳市天使投资引导基金管理有限公司招聘备考题库及答案详解一套.docx VIP
- 汽车理论余志生课后习题答案(正确).doc VIP
- 一种基于自动控制原理的碱性电解槽动态模型建模方法.pdf VIP
- 2026年深圳市天使投资引导基金管理有限公司招聘备考题库及答案详解参考.docx VIP
- 2026年深圳市天使投资引导基金管理有限公司招聘备考题库及一套答案详解.docx VIP
- JJF(津)170-2026 企业温室气体排放计量器具配备和管理规范 城镇燃气供应.pdf VIP
原创力文档

文档评论(0)