网站大量收购闲置独家精品文档,联系QQ:2885784924

大数据技术应用操作手册.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据技术应用操作手册

TOC\o1-2\h\u32596第1章大数据技术概述 4

105691.1大数据概念与特征 4

109581.1.1概念 4

236871.1.2特征 4

182251.2大数据技术架构 4

244831.2.1数据采集 4

177071.2.2数据存储 4

80391.2.3数据处理 5

271141.2.4数据分析 5

209071.2.5数据安全与隐私保护 5

3007第2章数据采集与预处理 5

296762.1数据源接入 5

309392.1.1数据源类型 5

285692.1.2数据源接入方式 6

2372.2数据清洗 6

65862.2.1数据质量评估 6

83572.2.2数据清洗方法 6

125112.3数据转换与整合 6

16462.3.1数据转换 6

213712.3.2数据整合 7

8668第3章分布式存储技术 7

312473.1Hadoop分布式文件系统(HDFS) 7

152643.1.1HDFS概述 7

71343.1.2HDFS架构 7

168963.1.3HDFS特点 7

66493.2分布式数据库HBase 8

56653.2.1HBase概述 8

112313.2.2HBase架构 8

186073.2.3HBase特点 8

87233.3分布式列式存储系统Cassandra 8

267813.3.1Cassandra概述 8

138983.3.2Cassandra架构 8

238323.3.3Cassandra特点 8

7711第4章分布式计算框架 9

194284.1MapReduce编程模型 9

318664.1.1Map操作 9

224514.1.2Reduce操作 9

284234.1.3MapReduce执行流程 9

77444.2Spark计算框架 9

82954.2.1Spark核心概念 9

236004.2.2Spark编程模型 10

197244.3Flink实时计算框架 10

33334.3.1Flink核心概念 10

224964.3.2Flink编程模型 10

20397第5章NoSQL数据库技术 10

135995.1KeyValue存储数据库 10

236575.1.1KeyValue存储原理 11

258765.1.2常见的KeyValue存储数据库 11

325555.2文档型数据库 11

178075.2.1文档型数据库特点 11

249825.2.2常见的文档型数据库 11

308075.3列式存储数据库 11

26275.3.1列式存储原理 11

199415.3.2常见的列式存储数据库 12

25342第6章大数据查询与分析 12

243556.1Hive数据仓库 12

261336.1.1概述 12

56456.1.2安装与配置 12

212316.1.3基本操作 12

93096.1.4高级功能 12

32026.2Pig查询语言 12

83746.2.1概述 12

62476.2.2安装与配置 12

14986.2.3基本操作 12

111636.2.4高级操作 13

278986.3Impala实时查询 13

230816.3.1概述 13

253786.3.2安装与配置 13

269686.3.3基本操作 13

315546.3.4功能优化 13

166.3.5与其他工具的整合 13

2420第7章大数据挖掘与机器学习 13

39827.1数据挖掘算法与应用 13

65007.1.1分类算法 13

242287.1.2聚类算法 13

2667.1.3关联规则算法 14

133397.1.4时间序列分析 14

148637.2机器学习框架 14

166197.2.1Scikitlearn 14

162857.2.2TensorFlow 14

126437.2.3PyTorch 14

234017.2.4XGBoost 14

175387.3深度学习框架 1

文档评论(0)

180****1188 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档