大数据处理算法.docxVIP

  • 5
  • 0
  • 约1.12万字
  • 约 19页
  • 2022-09-07 发布于湖北
  • 举报
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。[6]大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。

---------宋停云与您分享---------- ---------宋停云与您分享---------- 、 、、 大数据处理算法 大数据处理算法 、 0 ---------宋停云与您分享---------- ---------宋停云与您分享---------- 大数据处理算法 目录 大数据处理算法一:Bitmap 算法 2 大数据处理算法二:Bloom Filter 算法 5 大数据处理算法三:分而治之/hash 映射 + hash 统计 + 堆/快速/归并排序 11 标签:算法,大数据,编程,面试题,腾讯 ---------宋停云与您分享---------- ---------宋停云与您分享---------- 大数据处理算法一:Bitmap 算法 腾讯面试题:给 20 亿个不重复的 unsignedint 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那 40 亿个数当中并且所耗内存尽可能的少? 解析:bitmap 算法就好办多了 所谓 bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。 例如,要判断一千万个人的状态,每个人只有两种状态:男人,女人,可以用 0,1 表示。那么就可以开一个 int 数组,一个 int 有 32 个位,就可以表示 32 个人。操作的时候可以使用位操作。

文档评论(0)

1亿VIP精品文档

相关文档