大数据课程简介.pptVIP

  • 556
  • 0
  • 约6.91千字
  • 约 62页
  • 2017-05-13 发布于湖北
  • 举报
大数据课程简介

(1)是跨平台,即无论用户使用个人电脑,手机还是平板电脑,所感受到的用户体验是相同或相近的。(2)是门户化,即用户无须启用其他软件就可以完成日常生活中大部分的工作和沟通,对于一些个性化的需求,则可以通过插件的形式来满足,比如新浪微博。(3)是碎片化,即将原来的大型软件进行模块化分解,使之成为独立的功能组建,用户可以按照其需求进行下载。通过碎片化,可以降低用户的总体拥有成本 * 8.3 大数据分析——数据存储 比如:传统的关系型数据库在存储学生数据时,必须先定义一张学生信息表,如果以后要增加学生的一些属性,则必须对这张表的模型进行修改。而NoSQL数据库不需要预先定义存储数据时的存储模型 。 图 学生A和学生B的NoSQL存储形式 * 8.3 大数据分析——MapReduce Map-Reduce 系统由廉价而通用的普通服务器构成,通过添加服务器节点的方式可线性扩展处理能力(ScaleOut),在成本和可扩展性上有巨大的优势。MapReduce架构能够满足“先存后处理”的离线批量计算需求。 但也存在局限性,其中最大的问题是时延过大,难以适用机器学习迭代、流处理等实时计算任务。 * 不支持分布式文件系统,数据集中存储 由高级语言通过调用标准函数传递消息实现并行计算 支持分布式文件系统 通过Map/Reduce函数实现分布并行运算 对文件系统的支持 计算节点由开发者指定 系统自动选择

文档评论(0)

1亿VIP精品文档

相关文档