- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
读书笔记模板大数据:从基础理论到最佳实践
01思维导图目录分析读书笔记内容摘要作者介绍精彩摘录目录0305020406
思维导图
大数据实践技术部署大数据基础原理第章小结大数据数据编程数据仓库接口使用结构架构命令行初识本书关键字分析思维导图
内容摘要
内容摘要本书侧重于大数据的实践性技术,系统地介绍了主流大数据平台及工具的安装部署、管理维护和应用开发。平台和工具的选择均为当前业界主流的开源产品,因此,对于读者来说,有很强的可操作性。本书涉及的开源技术包括:HDFS、MapReduce、YARN、Zookeeper、HBase、Hive、Sqoop、Storm、Kafka、Flume等。除介绍一般性的背景知识、安装部署、管理维护和应用开发技术外,还特别注重案例实践,重要的技术点以实际工作场景或案例为依托,使读者能快速入门,参考案例动手实践,通过具体深入的实践,体会大数据的技术本质特征,领略大数据技术带来的创新理念,更好地理解和把握信息技术的发展趋势。本书主要内容包括以下几大部分。大数据存储篇:以HDFS为基础,介绍分布式文件系统的原理、安装、fs命令的使用、编程,介绍如何用HDFS实现,并通过HTTP调用。大数据计算篇:以MapReduce、YARN为基础,介绍分布式计算的原理、部署,以及编程案例。非关系型数据库篇:以HBase为基础,重点介绍非关系型数据库的优势、原理、部署,以及命令行使用,编程案例,与Sqoop配合使用等。大数据仓库篇:以Hive、数据仓库等为基础,重点介绍数据的抽取、原理、部署、分析与编程。大数据实时计算篇:以Storm、Kafka为基础,介绍实时计算的架构、组成、使用与开发。本书非常适合从事大数据技术开发与使用的初学者,以及从事大数据技术研发的企事业单位工程师学习和参考,也适合高校计算机相关专业的专科生、本科生和研究生学习使用。
目录分析
第1章概述第3章 HDFS操作实践第2章 HDFS文件系统大数据存储篇
第1章概述1.1什么是大数据1.2大数据的技术转型1.3数据分片1.4数据一致性1.5主流大数据技术1.6大数据职业方向1.7大数据实践平台的搭建1.8小结
第2章 HDFS文件系统2.1 HDFS概述2.2 HDFS的运行机制2.3 HDFS的数据存储2.4 HDFS的安装和配置2.5小结
第3章 HDFS操作实践3.1 HDFS接口与编程3.2操作实践3.3小结
第5章 MapReduce第4章 YARN大数据计算篇
第4章 YARN4.1 YARN概述4.2 YARN的主要组成模块4.3 YARN的整体设计4.4容量调度器4.5公平调度器(Fair Scheduler)4.6资源管理者(RM)重启机制4.7资源管理器的高可用性(RM HA)4.8节点标签4.9 YARN编程
第5章 MapReduce5.1 MapReduce概述5.2 Key-Value结构的特点5.3 MapReduce的部署5.4 MapReduce的程序结构5.5 MapReduce的编程接口5.6 MapReduce的命令行5.7 WordCount的实现5.8小结
第7章 HBase编程开发第6章使用HBase非关系型数据库篇
第6章使用HBase6.1 HBase基础6.2 HBase的架构原理6.3 HBase的命令实践6.4 HBase的数据管理6.5 HBase的集群管理6.6小结
第7章 HBase编程开发7.1 HBase的编程接口7.2表与命名空间的编程7.3数据编程7.4集群与优化编程7.5小结
第9章 Hive第8章数据仓库概论大数据仓库篇
第8章数据仓库概论8.1初识数据仓库8.2数据仓库的核心概念8.3数据仓库中的数据内容划分8.4 OLAP8.5 ETL8.6调度和运行8.7数据仓库的架构8.8数据仓库的展望8.9小结
第9章 Hive9.1初识Hive9.2 Hive命令行接口9.3 Hive数据类型与常见的结构9.4 HiveSQL9.5 Hive的自定义函数9.6 Hive的高级使用9.7使用Hive构建数据仓库9.8小结
大数据实时计算篇
第10章 Storm实时系统10.1大数据实时系统概述10.2 Kafka分布式消息系统10.3 Storm实时处理系统10.4小结
作者介绍
同名作者介绍这是《大数据:从基础理论到最佳实践》的读书笔记模板,暂无该书作者的介绍。
读书笔记
读书笔记这是《大数据:从基础理论到最佳实践》的读书笔记模板,可以替换为自己的心得。
精彩摘录
精彩摘录这是《大数据:从基础理论到最佳实践》的读书笔记模板,可以替换为自己的精彩内容摘录。
谢谢观看
文档评论(0)