数据采集1+x中级模拟习题+参考答案.docx

数据采集1+x中级模拟习题+参考答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共19页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

数据采集1+x中级模拟习题+参考答案

一、单选题(共63题,每题1分,共63分)

1.HBase依靠()存储底层数据。

A、HDFS

B、Hadoop

C、Memory

D、MapReduce

正确答案:A

2.关于Python语言的特点,以下选项中描述错误的是

A、Python语言是跨平台语言

B、Python语言是多模型语言

C、Python语言是非开源语言

D、Python语言是脚本语言

正确答案:C

3.用vi打开一个文件,如何用字母new来代替字母old()

A、:s/old/new/g

B、:1.$s/old/new/g

C、:s/old/new

D、:r/old/new

正确答案:B

4.分层网络设计模型中的哪一层提供了将设备接入网络的途径并控制允许那些设备通过网络进行通信?

A、核心层

B、网络层

C、应用层

D、接入层

E、分布层

正确答案:D

5.对于爬虫抓取所需数据的url地址,以下说法正确的是

A、浏览器地址栏中的地址就是数据抓取的地址

B、URL请求序列中的第一个URL有可能是数据抓取的地址,但并不确定,这要看是否是异步请求

C、URL请求序列中的第一个URL就是数据抓取的地址

D、数据抓取的地址的确定,要从异步请求、服务器端重定向、JS等多方面分析

正确答案:D

6.在Windows中,对文件夹进行复制时,()

A、只复制文件夹名,不复制其内容

B、只复制文件夹名和其下的文件,不复制其下的文件夹

C、复制文件夹名的其下所有的文件和子文件夹

D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文件

正确答案:C

7.从后台启动进程,应在命令的结尾加上符号()

A、@

B、#

C、

D、$

正确答案:C

8.与Apache网络和系统相关的选项中,设置监听端口号为80代码为()

A、Listener80

B、Listen80

C、Lis80

D、Listene80

正确答案:B

9.关键信息基础设施的运营者在中华人民共和国境内运营中收集和产生的个人信息和重要数据应当在()存储。

A、境外

B、境内

C、国内

D、国外

正确答案:B

10.以下关于xpath的描述,不正确的是

A、使用Xpath技术可以获取整个网页的内容

B、用XPath从HTML源代码中提取信息可以大大提高效率

C、XPath(XMLPath)是一种查询语言

D、它能在XML和HTML的树状结构中寻找结点

正确答案:A

11.下面哪个不是数据库系统必须提供的数据控制功能

A、并发控制

B、安全性

C、完整性

D、可移植性

正确答案:D

12.选取价格高于35的price节点?

A、/book[price35]/price

B、/bookstore/book[price35]

C、/bookstore/book[price35]/price

D、以上都可以

正确答案:C

13.下列不属于操作系统类型的是()。

A、批处理系统

B、实时系统

C、模拟系统

D、分时系统

正确答案:C

14.正则表达式中,下列()表达式是求整数?

A、^-?d+

B、^-?d$

C、^-d+$

D、^-?d+$

正确答案:D

15.以下哪个HTTP头的作用是将爬虫伪装成正常的浏览器的

A、User-Agent

B、Referer

C、Accept

D、Accept-Encoding

正确答案:A

16.数据采集是利用一种装置或程序从系统外部采集数据并输入到系统内部的一个()

A、模型

B、语言

C、接口

D、方式

正确答案:C

17.下面列出了路由器的各种命令状态,可以配置路由器全局参数的(即配置模式)是()

A、router﹥

B、router(config)#

C、router#

D、router(config-if)#

正确答案:D

18.数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特性()

A、全面性、多维性、高效性

B、多维性、灵活性、高延迟

C、低维度、高并发、高速率

D、单一化、低维度、低并发

正确答案:A

19.()用来建立数据库、建立表等,主要包括CREATEDATABASE、CREATETABLE等语句。

A、DML(DataManipulationLanguage,数据操纵语言)

B、DDL(DataDefinitionLanguage,数据定义语言)

C、DQL(DataQueryLanguage,数据查询语言)

D、DCL(DataControlLanguage,数据控制语言)

正确答案:B

20.关于Python的lambda函数,以下选项中描述错误的是()

A、lambda用于定义简单的、能够在一行内表示的函数

B、lambda函数将函数名作为函数结果返回

C、可以使用lambda函数定义列表的排序原则

D

文档评论(0)

500-500 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档