- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
Spark大数据分析实战
目录
第1章Spark简介
1.1初识Spark
1.2Spark生态系统BDAS
1.3Spark架构与运行逻辑
1.4弹性分布式数据集
1.4.1RDD简介
1.4.2RDD算子分类
1.5本章结
第2章Spark开发与环境配置
2.1Spark应用开发环境配置
2.1.1使用Intellii开发Spark程序
2.1.2使用SparkShell进行交互式数据分析
2.2远程调试Spark程序
2.3Spark编译
2.4配置Spark源码阅读环境
2.5木章结
第3章BDAS简介
3.1SOLonSpark
3.1.1为什么使用SparkSOL
3.1.2SparkSQL架构分析
3.2SparkStreaming
321SparkStreaming简介
3.2.2SparkStreaming架构
3.2.3SparkStreaming原理剖析
3.3GraphX
3.3.1GraphX简介
3.3.2GraphX的使用简介
3.3.3GraphX体系结构
3.4MLli
3.4.1MLli简介
342MLii中的聚类和分类
3.5本章结
4.1日志分析概述
4.2日志分析指标
4.3Lamda架构
44构建日志分析数据流水线
4.41用Flume进行日志采集
4.4.2用Kafka将口志汇总
4.4.3用SparkStreaming进行实时H志分析
444SparkSQL离线口志分析
445用Flask将日志KPI可视化
4.5本章结
第5章基于云平台和用户日志的推荐系统
5.1Azure云平台简介
5.1.1Azure网站模型
5.1.2Azure数据存储
5.1.3AzureQueue消息传递
5.2系统架构
5.3构建Node.js应用
5.3.1创建AzureWe应用
5.3.2构建本地Node.js网站
533发布应用到云平台
5.4数据收集与预处理
5.4.1通过IS收集用户行为日志
5.4.2用户实时行为回传到AzureQueue
5.5SparkStreaming实时分析用户日志
5.5.1构建AzureQueue的SparkStreamingReceiver
5.5.2SparkStreaming实时处理AzureOueue口志
5.5.3SparkStreaming数据存储于AzureTale
5.6MLli离线训练模型
561加载训练数据
5.6.2使用ratingRDD训练ALS模型
563使用ALS模型进行电影推荐
564评估模型的均方差
5.7本章结
第6章Twitter情感分析
6.1系统架构
6.2Twitter数据收集
6.2.1设置
6.2.2SparkStreaming接收并输出Tweet
您可能关注的文档
- SH-210scanhome扫码枪详细设置手册VV1(二).pdf
- SIXSIGMA六标准差资料.pdf
- SMT操作员培训手册.pdf
- SMT操作员培训手册SMT培训资料.pdf
- Spc制程质量衡量方式的演进培训课程.pdf
- SPSS数据分析与应用(微课版)-课后习题答案.pdf
- SRX-WebUI-配置手册资料.pdf
- SUV汽车项目申报材料.pdf
- S参数定义、矢量网络分析仪基础知识和S参数测量.pdf
- S预算操作手册.pdf
- 2024年学校党总支巡察整改专题民主生活会个人对照检查材料3.docx
- 2025年民主生活会个人对照检查发言材料(四个带头).docx
- 县委常委班子2025年专题生活会带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”对照检查材料四个带头:.docx
- 巡察整改专题民主生活会个人对照检查材料5.docx
- 2024年度围绕带头增强党性、严守纪律、砥砺作风方面等“四个方面”自我对照(问题、措施)7.docx
- 2025年度民主生活会领导班子对照检查材料(“四个带头”).docx
- 国企党委书记2025年度民主生活会个人对照检查材料(五个带头).docx
- 带头严守政治纪律和政治规矩,维护党的团结统一等(四个方面)存在的问题整改发言提纲.docx
- 党委书记党组书记2025年带头增强党性、严守纪律、砥砺作风方面等“四个带头”个人对照检查发言材料.docx
- 2025年巡视巡察专题民主生活会对照检查材料.docx
文档评论(0)