2025江西萍乡萍钢安源钢铁有限公司大数据专业人才招聘笔试历年参考题库附带答案详解.docxVIP

  • 2
  • 0
  • 约1.53万字
  • 约 30页
  • 2026-06-06 发布于北京
  • 举报

2025江西萍乡萍钢安源钢铁有限公司大数据专业人才招聘笔试历年参考题库附带答案详解.docx

2025江西萍乡萍钢安源钢铁有限公司大数据专业人才招聘笔试历年参考题库附带答案详解

一、选择题

从给出的选项中选择正确答案(共50题)

1、在大数据处理流程中,下列哪项技术主要用于解决海量非结构化数据的存储与检索问题?

A.MySQL关系型数据库

B.HadoopHDFS分布式文件系统

C.Redis内存缓存数据库

D.Excel电子表格软件

2、下列关于数据清洗的说法,错误的是:

A.缺失值处理可采用均值填充或删除记录

B.异常值检测可借助箱线图或Z-score方法

C.数据清洗只需在建模前进行一次即可

D.重复数据应通过主键或组合字段去重

3、在Python的Pandas库中,用于按指定列对DataFrame进行分组聚合操作的函数是:

A.merge()

B.groupby()

C.pivot_table()

D.concat()

4、下列哪种算法属于无监督学习方法?

A.逻辑回归

B.支持向量机

C.K-means聚类

D.随机森林

5、关于SQL中的JOIN操作,下列说法正确的是:

A.LEFTJOIN返回右表所有记录及左表匹配记录

B.INNERJOIN仅返回两表中满足连接条件的记录

C.FULLOUTERJOIN在MySQL中原生支持

D.CROSSJOIN会产生笛卡尔积,实际应用中应避免使用

6、在数据可视化中,若要

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档