- 6
- 0
- 约3.32千字
- 约 3页
- 2021-11-18 发布于江苏
- 举报
第一章
1、在信息产业的发展历程中,计算和数据作为两个重要的内在动力在不同时期
起着重要作用。
5、吉姆·格雷(Jim Gray )提出了第四范式,被誉为“大数据之父”。
6、MapReduce 的思想来源是Lisp 编程语言。
7、按照资源封装层次,云计算可分为基础设施既服务、平台既服务、软件既服
务三种类型。
8、与传统的资源提供方式相比,与计算具有什么特点?
云计算技术是资源与用户需求之间是一种弹性化的关系,资源的实用这之需
对资源的使用按需付费,从而敏捷地响应客户不断变化的需求,从而降低了资源
使用者的成本,提高了走远利用的效率。
10、简述主要的大数据的处理系统。
(1)数据查询分析计算系统:对大规模莫数据进行事时或准时查询
(2 )批处理系统:典型代表有MapReduce 计算模式的Hadoop 与Spark
(3 )流式计算系统:具有很强的实时系统,需要对应用源源不断产生的数据实
时进行处理,使数据不积压、不丢失,常用于处理电信、电力等行业应用与互联
网恒业的访问日志等。
(4 )迭代计算系统:iMapReduce、Twister、Spark、Hadoop 等。
(5 )图计算系统:图数据需要专门的系统进行存储和计算。常用的计算系统有:
Giraph、Pregel、Trinity、GraphX 等
(6 )内存计算系统:Dremel、HANA、Spark 等
11、简述大数据处理的基本流程。
(1)数据抽取与集成:从数据中取出关系与实体,经过关联和聚合等操作,按
照统一的格式进行存储。
(2 )数据分析:是大数据处理流程的核心步骤,通过数据抽取和集成环节获得
原始数据后用户可以根据自己的需求对这些数据进行分析处理。
(3 )数据解释:可视化和人机交互是书记解释的主要技术。
第二章
1、简述一致性哈希算法的基本原理。
一致性哈希算法的设计目标是解决节点频发变化时的任务分配问题。一致性哈希
算法将整个哈希空间组织成一个哈希环。比如将 ip 作为关键字哈希,确定每个
结点在哈希环上的位置,将key 用函数映射到哈希空间上的某个值,沿该值向后,
将遇到的第一个节点作为处理节点。节点数不多时可以引入虚拟节点解决负载不
均衡的问题。Key 值在哈希环中找到大于它的最小节点作为路由值。
2、科学研究的四个范式是经验、理论、实验、海量数据。
3、物联网的产业链可以分为标识、感知、处理和信息传递4 个环节。
4 、非关系型数据库可以分为Column-Oriented、Key-Value、Document-Value。
第三章
2、虚拟化技术从计算体系层次结构上可以分为以下5 种类型:指令集架构级虚
拟化、硬件抽象层虚拟化、操作系统层虚拟化、编程语言层上的虚拟化、库函数
层的虚拟化。
4 、系统虚拟化具有硬件无关性、隔离性、多实例、特权功能等优点。
5、系统虚拟化可分为一虚多、多虚一、多虚多。
6、服务器虚拟化按照其虚拟化部件可分为CPU 虚拟化、内存虚拟化、I/O 虚拟
化。
7、什么是广义虚拟化技术?
逻辑简化技术,实现物理层想逻辑层的变化。
8、虚拟化技术有哪些优势与劣势?
优势:提高资源利用率;提供相互隔离的、高效的运行环境;简化资源和资源管
理;实现软件和硬件的分离。
劣势:肯呢个回事物理计算机负载过重;升级和维护的安全问题;物理计算机的
影响。
第四章
3、传统的集群系统可以分为高可用性集群系统、负载均衡集群系统、高性能集
群系统、虚拟化集群系统4类。
4、简述Beowulf系统的主要特点。
用廉价系统实现高性能的能力。
(1)由一个管理节点和多个计算节点构成。
(2)同城由最城建的硬件系统构成。
(3)通常采用廉价且广范传播的软件。
5、Lustre存储系统的组成有元数据服务器、元数据存储节点、对象存储服务器、
对象存储节点、客户端。
6、简述面向对象的分布式系统、混合型分布试系统、面向数据的分布式系统的
实现机制,分析三种系统的区别。
三种系统的实现机制分别为:计算拆分、数据拆分、数据拆分
区别:混合式系统具有面向计算和面向数据的特征以集中式的存储和数据想计算
迁移的方式实现计算和数据位置的一致性。面向数据的分布式系统往往有对应的
文件系统支持,从文件存储实现数据块的划分。计算和数据协作机制为核心问题。
面向计算的分布试系统具有灵活和功能强大的计算能力能完成大多数问题的计
算任务,面向数据的分布试系统能较好地解决海量数据的自动分布式分布式处理
问题。
第五章
1、什么是MPI?
MPI是一种消息传递编程模型并成为这种编程模型的代表和事实
原创力文档

文档评论(0)