网站大量收购闲置独家精品文档,联系QQ:2885784924

Spark大数据分析实战.pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多

Spark大数据分析实战

目录

第1章Spark简介

1.1初识Spark

1.2Spark生态系统BDAS

1.3Spark架构与运行逻辑

1.4弹性分布式数据集

1.4.1RDD简介

1.4.2RDD算子分类

1.5本章结

第2章Spark开发与环境配置

2.1Spark应用开发环境配置

2.1.1使用Intellii开发Spark程序

2.1.2使用SparkShell进行交互式数据分析

2.2远程调试Spark程序

2.3Spark编译

2.4配置Spark源码阅读环境

2.5木章结

第3章BDAS简介

3.1SOLonSpark

3.1.1为什么使用SparkSOL

3.1.2SparkSQL架构分析

3.2SparkStreaming

321SparkStreaming简介

3.2.2SparkStreaming架构

3.2.3SparkStreaming原理剖析

3.3GraphX

3.3.1GraphX简介

3.3.2GraphX的使用简介

3.3.3GraphX体系结构

3.4MLli

3.4.1MLli简介

342MLii中的聚类和分类

3.5本章结

4.1日志分析概述

4.2日志分析指标

4.3Lamda架构

44构建日志分析数据流水线

4.41用Flume进行日志采集

4.4.2用Kafka将口志汇总

4.4.3用SparkStreaming进行实时H志分析

444SparkSQL离线口志分析

445用Flask将日志KPI可视化

4.5本章结

第5章基于云平台和用户日志的推荐系统

5.1Azure云平台简介

5.1.1Azure网站模型

5.1.2Azure数据存储

5.1.3AzureQueue消息传递

5.2系统架构

5.3构建Node.js应用

5.3.1创建AzureWe应用

5.3.2构建本地Node.js网站

533发布应用到云平台

5.4数据收集与预处理

5.4.1通过IS收集用户行为日志

5.4.2用户实时行为回传到AzureQueue

5.5SparkStreaming实时分析用户日志

5.5.1构建AzureQueue的SparkStreamingReceiver

5.5.2SparkStreaming实时处理AzureOueue口志

5.5.3SparkStreaming数据存储于AzureTale

5.6MLli离线训练模型

561加载训练数据

5.6.2使用ratingRDD训练ALS模型

563使用ALS模型进行电影推荐

564评估模型的均方差

5.7本章结

第6章Twitter情感分析

6.1系统架构

6.2Twitter数据收集

6.2.1设置

6.2.2SparkStreaming接收并输出Tweet

文档评论(0)

微传科技 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体唐山市微传科技有限公司
IP属地河北
统一社会信用代码/组织机构代码
91130281MA0DTHX11W

1亿VIP精品文档

相关文档