- 333
- 0
- 约1.65万字
- 约 32页
- 2017-08-27 发布于河南
- 举报
PythonHadoop构建数据仓库
从开源中来 到开源中去
,
EasyHadoop 童小军
tongxiaojun@
2012年10年20日
演讲大纲
• 个人介绍
• 思考数据分析系统的基本指标
• Hadoop史前和史后的数据仓库流程
• Hadoop史前和史后的数据分析流程
• 思考Hadoop解决了什么样的根本问题
• Python 如何在构建数据仓库系统的作用
– 1. 使用Python快速构建 数据分析模块 ComETL
– 2. 基于Python MapReduce Streaming 快速并行编程
– 3. Hive如果内嵌Python实现自定义逻辑
– 4. Pig内嵌JPython 实现PageRank挖掘算法
– 5. JPython MapReduce 框架 Pydoop Happy 等。
• 使用开源软件配合Python快速构建数据仓库
• EasyHadoop提供的资料[EasyHadoop部署安装手
您可能关注的文档
最近下载
- 深度解析(2026)《DLT 1768-2017旋转电机预防性试验规程》.pptx VIP
- 2026云南西双版纳州中级人民法院招聘聘用制审判辅助人员7人笔试备考试题及答案解析.docx VIP
- 雨、污水管道井下有限空间作业安全专项方案.docx VIP
- SH_T 3560-2017 石油化工立式圆筒形低温储罐施工质量验收规范.docx VIP
- SJG 108-2022 超高层建筑混凝土技术规程.docx
- (2026版)电力重大事故隐患判定标准及治理监督管理规定PPT课件.pptx VIP
- (完整版)公路养护安全作业规程:JTGH30-2015(word版,第60页至封底).docx VIP
- (高清版)B-T 3836.2-2021 爆炸性环境 第2部分:由隔爆外壳“d”保护的设备.pdf VIP
- 2026云南西双版纳州中级人民法院招聘聘用制审判辅助人员7人笔试参考试题及答案解析.docx VIP
- SH3537-立式圆筒形低温储罐施工技术规程.pdf VIP
原创力文档

文档评论(0)