5. Hadoop中的数据库技术.pptVIP

  • 9
  • 0
  • 约 21页
  • 2016-11-23 发布于湖北
  • 举报
提 纲 ? Hadoop简介 ? Hadoop分布式文件系统HDFS ? 分布式数据处理MapReduce ? 分布式结构化数据表HBase Hadoop简介 Hadoop——Apache开源组织的一个分布式计算框架,可以在大量廉价的硬件设备组成的集群上运行应用程序,为应用程序提供了一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统 Hadoop云计算系统 Google云计算系统 Hadoop HDFS Google GFS Hadoop MapReduce Google MapReduce Hadoop HBase Google Bigtable Hadoop ZooKeeper Google Chubby Hadoop Pig Google Sawzall Hadoop云计算系统与Google云计算系统 Hadoop简介 开源项目Lucene:Java开发的 开源高性能全文检索工具包 开源项目Nutch:第一个开源的 Web搜索引擎 Hadoop Hadoop简介 Hadoop项目组成 ?(1)Hadoop Common ?(2)Avro ?(3)Chukwa ?(4)HBase ?(5)HDFS ?(6)Hive ?(7)MapReduce ?(8)Pig ?(9)ZooKeeper Hadoop优点 ?(1)可扩展

文档评论(0)

1亿VIP精品文档

相关文档