《大数据工具应用》章节测试答案.docxVIP

  • 121
  • 0
  • 约8.86千字
  • 约 35页
  • 2022-07-22 发布于境外
  • 举报
第一章 1 、2011 年麦肯锡研究院提出的大数据定义是:大数据是指其大小超出了常规数据库工具获 取、储存、管理和( )能力的数据集。 A:计算 B:访问 C:应用 D:分析 答案:分析 2 、 用 4V 来概括大数据的特点的话,一般是指: Value 、Velocity 、Volume 和()。 A:Variety B:Vainly C:Vagary D:Valley 答案: Variety 3 、 大数据分析四个方面的工作主要是:数据分类、 ()、关联规则挖掘和时间序列预测。 A:数据统计 B:数据计算 C:数据聚类 D:数据清洗 答案:数据聚类 4 、 新浪和京东联合推出的大数据商品推荐, 是由京东盲目推送到当前浏览新浪网站的用户的 页面 上的。 A:对 B:错 答案:错 5、目前的大数据处理技术只能处理结构化数据。 A:对 B:错 答案:错 第二章 1 、 我们常用的微软 Office 套件中的 Access 数据库软件的数据库文件格式后缀名是( ) 。 A:mdf B:mdb C:dbf D:xls 答案:mdb 2 、大多数日志文件的后缀名是( )。 A:txt B:csv C:xml D:log 答案:log 3 、 本课程重点介绍的 weka 软件的专有文件格式是( )。 A:MongoDB B:ARFF C:value D:key map 答案:ARFF 4 、数据清洗工作的目的主要是要解决数据的完整性、唯一性、合法性和( )。 A:专业性 B:排他性 C: 一致性 D:共享性 答案:一致性 5 、 八爪鱼软件的“自定义采集”工作方式下, 需要在软件里输入一个 ()来作为采集的目 标。 A:电话号码 B:关键词 C:网页地址 D:用户名 答案:网页地址 6 、 八爪鱼软件的采集规则可以通过文件的形式来导入或者导出, 这种文件的后缀名是 ()。 A:otd B:jpg C:png D:gif 答案:otd 7 、Excel 可以通过“数据有效性”按钮操作来规范数据输入的范围。 A:对 B:错 答案:对 8 、 Excel 不能导入 txt 或 csv 格式的文件。 A:对 B:错 答案:错 9 、 八爪鱼软件只能对软件内建了 “简易采集”规则的网站采集数据。 A:对 B:错 答案:错 10 、 八爪鱼软件进行自定义采集时,需要了解对网页的页面结构

文档评论(0)

1亿VIP精品文档

相关文档