不适合使用的场景.docxVIP

  • 26
  • 0
  • 约 5页
  • 2017-01-10 发布于北京
  • 举报
不适合使用的场景

不适合使用Hadoop的场景。  Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候,会听到脱口而出的回答:Hadoop! ?实际上Hadoop被设计和建造出来,是用来解决一系列特定问题的。对某些问题来说,Hadoop至多算是一个不好的选择,对另一些问题来说,选择Hadoop甚至会是一个错误。对于数据转换的操作,或者更广泛意义上的抽取-转换-装载的操作,使用Hadoop系统能够得到很多好处,但是如果你的问题是下面5类之中的一个的话,Hadoop可能会是一不合适的解决方案。  1.对于大数据的渴望——数据规模在TB/PB以下的应用不适合  很多人相信他们拥有正真“大”的数据,但通常情况并非如此。当考虑数据容量和理解大多数人对“大数据”处理的想法的时候,我们应当参考这篇研究论文,没有人会因为买了一个集群的服务器而被辞退,它告诉了我们一些有趣的事实。 Hadoop是被设计成用来处理在TB或PB级别的数据的,而世界上大多数的计算任务处理的是100GB以下的输入数据。(Microsoft和Yahoo在这个数据统计上的中位数是14GB,而90% Facebook的任务处理的是100GB以下的数据)。对于这样的情况来说,纵向扩展的解决方案就会在性能上胜过横向扩展(scale-out)的解决方案。  (译者注:纵向扩展scale-up通常

文档评论(0)

1亿VIP精品文档

相关文档