Python+Hadoop 构建数据仓库.pdfVIP

  • 333
  • 0
  • 约1.65万字
  • 约 32页
  • 2017-08-27 发布于河南
  • 举报
PythonHadoop构建数据仓库 从开源中来 到开源中去 , EasyHadoop 童小军 tongxiaojun@ 2012年10年20日 演讲大纲 • 个人介绍 • 思考数据分析系统的基本指标 • Hadoop史前和史后的数据仓库流程 • Hadoop史前和史后的数据分析流程 • 思考Hadoop解决了什么样的根本问题 • Python 如何在构建数据仓库系统的作用 – 1. 使用Python快速构建 数据分析模块 ComETL – 2. 基于Python MapReduce Streaming 快速并行编程 – 3. Hive如果内嵌Python实现自定义逻辑 – 4. Pig内嵌JPython 实现PageRank挖掘算法 – 5. JPython MapReduce 框架 Pydoop Happy 等。 • 使用开源软件配合Python快速构建数据仓库 • EasyHadoop提供的资料[EasyHadoop部署安装手

文档评论(0)

1亿VIP精品文档

相关文档