- 5
- 0
- 约1.12万字
- 约 19页
- 2022-09-07 发布于湖北
- 举报
大数据包括结构化、半结构化和非结构化数据,非结构化数据越来越成为数据的主要部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。[6]大数据就是互联网发展到现今阶段的一种表象或特征而已,没有必要神话它或对它保持敬畏之心,在以云计算为代表的技术创新大幕的衬托下,这些原本看起来很难收集和使用的数据开始容易被利用起来了,通过各行各业的不断创新,大数据会逐步为人类创造更多的价值。
---------宋停云与您分享----------
---------宋停云与您分享----------
、
、、
大数据处理算法
大数据处理算法
、
0
---------宋停云与您分享----------
---------宋停云与您分享----------
大数据处理算法
目录
大数据处理算法一:Bitmap 算法 2
大数据处理算法二:Bloom Filter 算法 5
大数据处理算法三:分而治之/hash 映射 + hash 统计 + 堆/快速/归并排序 11
标签:算法,大数据,编程,面试题,腾讯
---------宋停云与您分享----------
---------宋停云与您分享----------
大数据处理算法一:Bitmap 算法
腾讯面试题:给 20 亿个不重复的 unsignedint 的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那 40 亿个数当中并且所耗内存尽可能的少?
解析:bitmap 算法就好办多了
所谓 bitmap,就是用每一位来存放某种状态,适用于大规模数据,但数据状态又不是很多的情况。通常是用来判断某个数据存不存在的。
例如,要判断一千万个人的状态,每个人只有两种状态:男人,女人,可以用
0,1 表示。那么就可以开一个 int 数组,一个 int 有 32 个位,就可以表示 32
个人。操作的时候可以使用位操作。
您可能关注的文档
最近下载
- 2025 年宁波市高中数学竞赛数学试题.docx VIP
- 山东省2025年普通高校招生春季考试机电一体化专业知识试题.doc VIP
- 高脚竞速运动的起源发展与教学.doc VIP
- 2025年全国高考(新课标Ⅰ卷)英语真题卷含答案解析.pdf VIP
- 2025年湖北省图书、信息专业技术职务水平能力测试历年参考题库含答案详解(5卷).docx VIP
- 2025年高中数学课堂教学评价方案.docx VIP
- 建筑工程施工现场各工种施工配合管理.pptx VIP
- 《GBT+18242-2025 弹性体/塑性体改性沥青防水卷材》练习题试卷及参考答案.pdf VIP
- BS EN 593-2017 工业阀门.通用金属蝶阀.pdf VIP
- 洗餐具PPT课件教学课件.pptx VIP
原创力文档

文档评论(0)