- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据技术应用操作手册
TOC\o1-2\h\u32596第1章大数据技术概述 4
105691.1大数据概念与特征 4
109581.1.1概念 4
236871.1.2特征 4
182251.2大数据技术架构 4
244831.2.1数据采集 4
177071.2.2数据存储 4
80391.2.3数据处理 5
271141.2.4数据分析 5
209071.2.5数据安全与隐私保护 5
3007第2章数据采集与预处理 5
296762.1数据源接入 5
309392.1.1数据源类型 5
285692.1.2数据源接入方式 6
2372.2数据清洗 6
65862.2.1数据质量评估 6
83572.2.2数据清洗方法 6
125112.3数据转换与整合 6
16462.3.1数据转换 6
213712.3.2数据整合 7
8668第3章分布式存储技术 7
312473.1Hadoop分布式文件系统(HDFS) 7
152643.1.1HDFS概述 7
71343.1.2HDFS架构 7
168963.1.3HDFS特点 7
66493.2分布式数据库HBase 8
56653.2.1HBase概述 8
112313.2.2HBase架构 8
186073.2.3HBase特点 8
87233.3分布式列式存储系统Cassandra 8
267813.3.1Cassandra概述 8
138983.3.2Cassandra架构 8
238323.3.3Cassandra特点 8
7711第4章分布式计算框架 9
194284.1MapReduce编程模型 9
318664.1.1Map操作 9
224514.1.2Reduce操作 9
284234.1.3MapReduce执行流程 9
77444.2Spark计算框架 9
82954.2.1Spark核心概念 9
236004.2.2Spark编程模型 10
197244.3Flink实时计算框架 10
33334.3.1Flink核心概念 10
224964.3.2Flink编程模型 10
20397第5章NoSQL数据库技术 10
135995.1KeyValue存储数据库 10
236575.1.1KeyValue存储原理 11
258765.1.2常见的KeyValue存储数据库 11
325555.2文档型数据库 11
178075.2.1文档型数据库特点 11
249825.2.2常见的文档型数据库 11
308075.3列式存储数据库 11
26275.3.1列式存储原理 11
199415.3.2常见的列式存储数据库 12
25342第6章大数据查询与分析 12
243556.1Hive数据仓库 12
261336.1.1概述 12
56456.1.2安装与配置 12
212316.1.3基本操作 12
93096.1.4高级功能 12
32026.2Pig查询语言 12
83746.2.1概述 12
62476.2.2安装与配置 12
14986.2.3基本操作 12
111636.2.4高级操作 13
278986.3Impala实时查询 13
230816.3.1概述 13
253786.3.2安装与配置 13
269686.3.3基本操作 13
315546.3.4功能优化 13
166.3.5与其他工具的整合 13
2420第7章大数据挖掘与机器学习 13
39827.1数据挖掘算法与应用 13
65007.1.1分类算法 13
242287.1.2聚类算法 13
2667.1.3关联规则算法 14
133397.1.4时间序列分析 14
148637.2机器学习框架 14
166197.2.1Scikitlearn 14
162857.2.2TensorFlow 14
126437.2.3PyTorch 14
234017.2.4XGBoost 14
175387.3深度学习框架 1
文档评论(0)