- 1、本文档共56页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
大数据技术导论读书笔记模板
01思维导图目录分析读书笔记内容摘要作者介绍精彩摘录目录0305020406
思维导图
导论技术技术特点大数据生命周期读者数据大数据习题分析第章可视化系统实验报告基础特征数据分析实验本书关键字分析思维导图
内容摘要
内容摘要本书以面向应用、面向实战为指导思想,紧扣企业技术人才培养的特点,在知识点讲解和实验中避免复杂的理论,使读者能快速上手体验、验证大数据处理的魅力,以激发读者的学习兴趣。本书覆盖了大数据生命周期中的主要技术要点,全书共8章,第1章介绍大数据的产生和特点及思维的变革,第2章了解大数据生态系统,第3~7章按照大数据的生命周期,分别讨论大数据采集与预处理、大数据管理、大数据分析、大数据可视化、大数据应用的基本原理和方法,第8章讨论大数据安全面临的挑战。本书可作为本科、高职院校大数据技术或数据科学课程的参考书或教材,也可供数据科学相关技术人员阅读。
目录分析
1.2Linux系统概述1.1揭秘大数据第1章概论
实验报告1Linux实验习题1第1章概论
1.1揭秘大数据1.1.1大数据产生历史必然1.1.2大数据概念和特征1.1.3大数据生命周期1.1.4大数据与物联网、云计算、人工智能1.1.5大数据时代的八个重大变革
1.2Linux系统概述1.2.1Linux版本1.2.2Linux系统目录结构1.2.3文本编辑器vi1.2.4文件权限解读1.2.5Linux系统常用命令
2.1认识Hadoop2.2HDFS2.3MapReduce*2.4Zookeeper第2章大数据生态系统
实验报告2Hadoop实验习题2第2章大数据生态系统
2.2HDFS2.2.1HDFS体系结构2.2.2HDFS存储原理2.2.3HDFS常用操作
2.3MapReduce2.3.1MapReduce逻辑结构2.3.2MapReduce操作案例
3.1数据3.2数据采集3.3数据清洗3.4网络爬虫第3章大数据采集与预处理
*实验报告3网络爬虫习题3第3章大数据采集与预处理
3.1数据3.1.1数据是什么3.1.2数据分类3.1.3度量和维度
3.2数据采集3.2.1数据采集分类3.2.2数据采集方法3.2.3数据采集工具
3.3数据清洗3.3.1数据清洗原理3.3.2缺失值和异常数据3.3.3数据清洗基本操作
3.4网络爬虫3.4.1爬虫简介*3.4.2论坛爬虫源代码分析
4.1NoSQL4.2HBase习题4实验报告4HBase实验第4章大数据管理
4.1NoSQL4.1.1NoSQL概述4.1.2键值数据库4.1.3图数据库4.1.4文档数据库4.1.5列式数据库4.1.6云数据库
4.2HBase4.2.1HBase模型4.2.2HBase与传统关系数据库的对比分析4.2.3HBase系统架构4.2.4HBase常用Shell命令
5.1大数据分析概述*5.2业务理解5.3数据认知5.4特征工程第5章大数据分析
5.5数据建模*5.6通用计算引擎Spark5.7大数据分析引擎Hive习题5实验报告5Hive实验12345第5章大数据分析
5.1大数据分析概述5.1.1数据分析原则5.1.2大数据分析特点5.1.3大数据分析流程5.1.4数据分析师基本技能和素质*5.1.5大数据分析难点
*5.2业务理解5.2.1什么是业务理解5.2.2如何理解业务5.2.3数据业务化
5.3数据认知5.3.1数据变换5.3.2概率分析*5.3.3对比分析*5.3.4细分分析*5.3.5交叉分析5.3.6相关分析
5.4特征工程5.4.1特征工程面临的挑战5.4.2特征选择5.4.3特征提取5.4.4指标设计
5.5数据建模5.5.1模型分类5.5.2决策树5.5.3关联分析5.5.4回归分析5.5.5聚类分析*5.5.6k-邻近分类算法KNN
*5.6通用计算引擎Spark5.6.1Spark简介5.6.2Spark与Hadoop差异5.6.3Spark适用场景5.6.4Spark运行模式5.6.5Spark常用术语5.6.6Spark编程实战——单词统计
5.7大数据分析引擎Hive5.7.1数据仓库概念5.7.2传统数据仓库的问题5.7.3Hive特征5.7.4Hive系统架构5.7.5Hive应用案例
6.1数据可视化基本概念6.2常用图形6.3数据可视化设计6.4数据可视化工具第6章大数据可视化
6.5基于R语言可视化基础*实验报告6可视化实验习题6第6章大数据可视化
6.1数据可视化基本概念6.1.1为什么要数据可视化6.1.2什么是数据可视化6.1.3数据可视化的作用6.1.4数据可视化术语6.1.5数据可视化三要素
6.2常
您可能关注的文档
- 小学体育开学第一课安全教育.pptx
- 纤维素溶剂的研究进展.pptx
- 习作:“漫画”老师(范文+点评+升格)-部编版语文五年级上册.pptx
- 文艺清新研究生保研自我介绍课件模板.pptx
- 微生物传感器.pptx
- 散文中的借物喻人.pptx
- 三年级开学第一课338.pptx
- 人教版小学美术四年级下册第3课《“五谷”作画》教学课件.pptx
- 人教版八年级数学上册12.3-角的平分线的性质-课件.pptx
- 抛物线及其标准方程课件课件.pptx
- 计及电动汽车移动储能动态电价的微电网优化调度研究及解决方案.pdf
- 浅谈电动汽车充电桩绝缘智能化自检装置的设计与应用 .pdf
- 浅谈电动汽车公共充电桩布局方案评价方法.pdf
- 浅谈基于弹性响应的电动汽车快充电价定价策略 汽车充电桩有序充电.pdf
- 浅谈光储充一体化社区的有序充电策略及解决方案.pdf
- 晚期肾透明细胞癌系统性治疗中国专家共识(2024版).pptx
- 中国膀胱癌保膀胱治疗多学科诊治协作共识(2022版).pptx
- 成人心血管外科手术体外循环患者血液管理指南.pptx
- 下尿路修复重建移植物应用规范中国专家共识.pptx
- 中国儿童急性非静脉曲张性上消化道出血诊治指南(2024).pptx
文档评论(0)