大数据基础 单元测试题及答案汇总 胡坚 单元2--8.docx

大数据基础 单元测试题及答案汇总 胡坚 单元2--8.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据基础

大数据

基础

单元2

测试答案

第PAGE\*Arabic1页/共NUMPAGES\*Arabic1页

单元2Linux简介

单元测试

单元2测试答案

单元2

测试答案

1

2

3

4

5

A

C

C

B

C

6

7

8

9

10

B

B

A

B

C

二、填空题

1.在给定文件中查找与设定条件相符字符串的命令为grep。

2.在/home目录中查找所有的用户目录的命令是find/home–typed。

3.vi编辑器具有三种工作模式,即命令模式、文本编辑模式和插入模式。

4.将前一个命令的标准输出作为后一个命令的标准输入,称之为管道。

5.在建立一个tar归档文件的时候列出详细列表的命令是tar?-t。?

三、简答题

1.Linux操作系统是一种自由和开放源代码的类UNIX操作系统,基于Linux内核构建。它以其高度的稳定性、安全性、灵活性和可定制性而闻名,支持多用户、多任务处理,并能在各种硬件平台上运行。Linux通过复杂的软件包管理系统(如APT、Yum/DNF)管理应用程序的安装与更新,且拥有庞大的开发者和用户社区。优点包括:高度稳定和安全:开源特性允许全球开发者审查代码,快速修复漏洞。兼容Unix,具备强大的命令行界面。软件包管理系统便于软件安装和维护。跨平台运行能力,支持多种CPU架构。支持广泛的网络协议和编程语言。低成本,多数发行版免费使用。

在Linux中创建新用户,通常使用useradd命令,例如useraddusername。之后,为了给新用户设置密码,可使用passwdusername命令。如果需要为用户指定额外属性(如主目录、shell等),可以添加相应的参数到useradd命令中。

Linux系统的目录结构是一种分层的树形结构,主要目录有:

/:根目录,所有其他目录的起点。

/home:存放普通用户的个人文件和目录。

/usr:包含大部分用户可执行文件、库文件、文档等。

/etc:存放系统配置文件。

/var:存放经常变化的数据,如日志、数据库文件等。

/tmp:临时文件存放地。

/bin,/sbin,/usr/bin,/usr/sbin:分别包含二进制可执行文件,前两者主要用于系统管理,后两者面向用户。

4.在Linux中安装软件包,根据不同的包管理系统有不同的命令:

使用APT(Debian/Ubuntu):sudoapt-getinstallpackage-name

使用YUM/DNF(Fedora/CentOS/RHEL):sudodnfinstallpackage-name或sudoyuminstallpackage-name

使用zypper(openSUSE):sudozypperinstallpackage-name

也可以手动下载软件包后,使用dpkg、rpm命令安装,或编译源代码安装。

开源的定义是指软件的源代码对公众开放,允许任何人查看、修改、复制和分发。开源强调的是软件的透明度、合作开发以及社区共享的理念,遵循特定的开源许可协议,如GNUGPL、MIT等,这些协议规定了软件如何被合法使用和分发。

单元3大数据存储与计算

单元测试

单元4

单元4

测试答案

1

2

3

4

5

C

A

D

B

B

6

7

8

9

10

B

D

A

C

B

二、填空题

1. 集中式、分布式

2. 命名空间镜像、编辑日志

3. put、get

4. 批处理、流处理

5. map、reduce

三、简答题

1. 分布式存储系统采用可扩展的系统结构,满足了大数据应用存储的需要,能够利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。

2. 任何基于网络的数据共享系统最多只能满足数据一致性(Consistency)、可用性(Availability)和分区容忍性(PartitionTolerance)三个特性中的两个。

3. HDFS的文件写入操作流程:客户端(ClientNode)通过向元数据节点(NameNode)申请在分布式文件系统中创建一个新的文件,元数据节点首先确定文件原来不存在,并且客户端有创建文件的权限,然后创建新文件。客户端开始准备写入数据,文件将会被分成多个

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档