- 6
- 0
- 约1.48万字
- 约 49页
- 2016-12-05 发布于北京
- 举报
2015第讲数据仓库
数据分析者面临的问题 数据日趋庞大,无论是入库和查询,都出现性能瓶颈 用户的应用和分析结果呈整合趋势,对实时性和响应时间要求越来越高 使用的模型越来越复杂,计算量指数级上升 数据分析者期待的解决方案 完美解决性能瓶颈,在可见未来不容易出现新瓶颈 过去所拥有的技能可以平稳过渡。比如SQL、R 转移平台的成本有多高?平台软硬件成本,再开发成本,技能再培养成本,维护成本 Hive简介 ?起源自facebook由Jeff Hammerbacher领导的团队 ?构建在Hadoop上的数据仓库框架 ?设计目的是让SQL技能良好,但Java技能较弱的分析师可 以查询海量数据 ?2008年facebook把hive项目贡献给Apache Hive 数据仓库工具。可以把Hadoop下的原始结构化数据变成Hive中的表 支持一种与SQL几乎完全相同的语言HiveQL。除了不支持更新、索引和事务,几乎SQL的其它特征都能支持 可以看成是从SQL到Map-Reduce的映射器 提供shell、JDBC/ODBC、Thrift、Web等接口 Hive不适合用于联机事务处理,也不提供实时查询功能。最适合应用在基于大量不可变数据的批处理作业。 Hive 是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进
您可能关注的文档
最近下载
- 禽病学.doc VIP
- 教师资格证历年真题及详细答案(2021-2025年).docx
- 2024年公司年度工作报告(34篇).docx VIP
- 2026年初级注册安全工程师(建筑施工安全)历年参考题库含答案详解.docx VIP
- 小学数学课堂中AI数学几何图形辅助教学实践课题报告教学研究课题报告.docx
- 太阳能预应力混凝土管桩专项施工方案.docx VIP
- 2025年山东省聊城市高唐县中考三模英语试题(附答案解析).docx VIP
- 人教版三年级数学下册期中综合测试卷(含答案解析)4套精品(全).docx VIP
- 四年级下册小数单位换算专项练习.pdf VIP
- 沈阳药科大学天然药物化学课件-第四章_醌类化合物.ppt VIP
原创力文档

文档评论(0)