大数据导论复习资料.pdf

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

《大数据导论》课程讲稿章节目录:

第章大数据概述

(1)大数据的概念

(2)大数据的特征

(3)大数据的数据类型

(4)大数据的技术

(5)大数据的应用

第2章大数据采集与预处理

(1)大数据采集

(2)大数据预处理概述

(3)数据清洗

(4)数据集成

(5)数据变换

(6)数据规约

第3章大数据存储

(1)大数据存储概述

(2)数据存储介质

(3)存储系统结构

(4)云存储概述

(5)云存储技术

(6)新型数据存储系统

(7)数据仓库

第4章大数据计算平台

(1)云计算概述

(2)云计算平台

(3)MapReduc坪台

Hadoop

(5)Spark平台

第5章大数据分析与挖掘

(6)大数据分析概述

(7)大数据分析的类型及架构

(8)大数据挖掘

(9)大数据关联分析

(10)数据分类

(11)数据聚类

(7)大数据分析工具

第6章大数据可视化

(1)大数据可视化概述

(2)大数据可视化方法

(3)大数据可视化工具

第7章社交大数据

(1)社交大数据

(2)国内社交网络大数据的应用

(3)国外社交网络大数据的应用

第8章交通大数据

(1)交通大数据概述

(2)交通监测应用

(3)预测人类移动行为应用

第9章医疗大数据

(1)医疗大数据简介

(2)临床决策分析应用

(3)医疗数据系统分析

第10章大数据的挑战与发展趋势

(1)大数据发展面临的挑战

(2)大数据的发展趋势

-、客观部分:(单项选择、多项选择)

一)、单项选择

以下不是NoSQ嗷据库的是()

★考核知识点:NoSQL与NewSQ主流系统

参考讲稿章节:

附(考核知识点解释):

目前市场上主要的NoSQ啜据存储工具有:BigTable、Dynamo、

HbaseMongoDBCouchDBHypertable

还存在一些其他的开源的NoSQ啜据库,Neo4j、

OracleBerkeleyDB、ApacheCassandra等

另外,NewSQLc据库。例如:GoogleSpanner、VoltDB、

RethinkDB、Clustrix、TokuDB?口MemSQL。

2以下不是目前主流开源分布式计算系统的是()

★考核知识点:主流开源分布式计算系统参见讲稿章节:附:(考

核知识点解释)

由于Google没有开源Google分布式计算模型的技术实现,所以

其他互联网公司只能根据Google三篇技术论文中的相关原理,

搭建自己的分布式计算系统。

DougCutting和MikeCafarella在2005年合作开

发了分布式计算系统Hadoop后来,Hadoop被贡献给了Apache

基金会,成为了Apache基金会的开源项目。Hadoop采用

MapReduce分布式计算框架,并根据GFS开发了HDFS分布式文

件系统,根据BigTable开发了HBase数据存储系统。尽管和Google

内部使用的分布式计算系统原理相同,但是Hadoop在运算速度

上依然达不到

文档评论(0)

各类考试卷精编 + 关注
官方认证
内容提供者

各类考试卷、真题卷

认证主体社旗县兴中文具店(个体工商户)
IP属地中国
统一社会信用代码/组织机构代码
92411327MAD627N96D

1亿VIP精品文档

相关文档