- 121
- 0
- 约8.86千字
- 约 35页
- 2022-07-22 发布于境外
- 举报
第一章
1 、2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获 取、储存、管理和( )能力的数据集。
A:计算
B:访问
C:应用
D:分析
答案:分析
2 、 用 4V 来概括大数据的特点的话,一般是指: Value 、Velocity 、Volume 和()。
A:Variety
B:Vainly
C:Vagary
D:Valley
答案: Variety
3 、 大数据分析四个方面的工作主要是:数据分类、 ()、关联规则挖掘和时间序列预测。
A:数据统计
B:数据计算
C:数据聚类
D:数据清洗
答案:数据聚类
4 、 新浪和京东联合推出的大数据商品推荐, 是由京东盲目推送到当前浏览新浪网站的用户的 页面
上的。
A:对
B:错
答案:错
5、目前的大数据处理技术只能处理结构化数据。
A:对
B:错
答案:错
第二章
1 、 我们常用的微软 Office 套件中的 Access 数据库软件的数据库文件格式后缀名是( ) 。
A:mdf
B:mdb
C:dbf
D:xls
答案:mdb
2 、大多数日志文件的后缀名是( )。
A:txt
B:csv
C:xml
D:log
答案:log
3 、 本课程重点介绍的 weka 软件的专有文件格式是( )。
A:MongoDB
B:ARFF
C:value
D:key map
答案:ARFF 4 、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。 A:专业性 B:排他性
C: 一致性
D:共享性
答案:一致性 5 、 八爪鱼软件的“自定义采集”工作方式下, 需要在软件里输入一个 ()来作为采集的目 标。 A:电话号码 B:关键词 C:网页地址 D:用户名
答案:网页地址 6 、 八爪鱼软件的采集规则可以通过文件的形式来导入或者导出, 这种文件的后缀名是 ()。 A:otd B:jpg C:png
D:gif
答案:otd
7 、Excel 可以通过“数据有效性”按钮操作来规范数据输入的范围。
A:对
B:错
答案:对
8 、 Excel 不能导入 txt 或 csv 格式的文件。
A:对
B:错
答案:错
9 、 八爪鱼软件只能对软件内建了 “简易采集”规则的网站采集数据。
A:对
B:错
答案:错
10 、 八爪鱼软件进行自定义采集时,需要了解对网页的页面结构
原创力文档

文档评论(0)