实战-基于HBase的大数据在线分析.pdfVIP

  • 15
  • 0
  • 约1.04万字
  • 约 27页
  • 2022-09-21 发布于湖南
  • 举报
实战-基于HBase的大数据在线分析 青道 阿里云技术专家 实战-基于HBase的大数据在线分析 01 背景介绍 02 在线交互式分析 03 离线及流式分析 04 总结 • 课程预览 • Spark分析 HBase数据 • 离线分析(Parquet+Spark) • HBase数据分析总结 • HBase数据访问概览 • Hive分析 HBase数据 • 流式分析 (Kafka+Spark) • 下一代产品 Lindorm • 准备工作 01 背景介绍 课程预览 What ? 基于HBase存储的应用数据,构建一套大数据处理框架, 在线分析 使用不同方式对HBase数据进行分析。 全量导出 - 离线分析 Why ? “LTS” HBase作为开源分布式数据库,具备高性能,高可用,海 批量写入/Bulkload On HDFS 量无限扩展的特点。然而HBase查询接口较简单,无法满 足数据分析的需求,但HBase具有丰富数据生态,可以结 合大量开源的组件对HBase进行数据分析。 App 增量订阅 - 流式分析 Who ? 高并发 “LTS” 大数据开发,希望了解HBase数据分析及大数据生态的用 读写 户。 How ? 本课程将从原理到代码编写,手把手教用户构建基于 HBase的大数据分析系统。 HBase数据访问概览 1.Api: 3.MapReduce框架: • API封装: • Put/Get/Scan + filter + coprocessor • 通过hbase client访问 • TableInputFormat

文档评论(0)

1亿VIP精品文档

相关文档