上海数据分析计算题及答案技巧.pdfVIP

  • 0
  • 0
  • 约5.61千字
  • 约 10页
  • 2026-03-06 发布于山东
  • 举报

上海数据分析计算题及答案技巧

一、单选题(每题2分,共20分)

1.在Excel中,函数=AVERAGE(B2:B10)的功能是()

A.计算2到10单元格的总和

B.计算2到10单元格的平均值

C.列出2到10单元格的所有数值

D.计算单元格B2和B10的差值

【答案】B【解析】函数AVERAGE(B2:B10)表示计算B2到B10单元格区域所有数值的平

均值。

2.在数据透视表中,要按部门字段分组并计算销售额的总和,应选择以下哪个操作?

()

A.将部门拖入行标签区域,将销售额拖入值区域

B.将部门拖入值区域,将销售额拖入行标签区域

C.将部门拖入筛选器区域,将销售额拖入值区域

D.将部门和销售额都拖入筛选器区域

【答案】A【解析】在数据透视表中,将分类字段(如部门)拖入行标签区域,将

计算字段(如销售额)拖入值区域,可实现分组统计。

3.若一组数据的中位数是60,众数是50,则这组数据的平均数最接近于()

A.55

B.60

C.65

D.70

【答案】A【解析】中位数受极端值影响较小,众数为50意味着50出现频率最高。由

于50是众数,而中位数60比平均数更接近50,故平均数应略大于55。

4.在SQL查询中,使用GROUPBY语句的主要目的是()

A.对数据进行排序

B.对数据进行筛选

C.对数据进行分组统计

D.筛选重复数据

【答案】C【解析】GROUPBY用于将多行数据按指定字段进行聚合,常配合聚合函数

(如SUM、AVG)进行统计分析。

5.以下哪种方法最适合处理缺失值?()

A.删除含有缺失值的行

B.用平均数填充缺失值

C.用中位数填充缺失值

D.以上皆可,视数据情况而定

【答案】D【解析】缺失值处理需结合数据特点:若数据对称可用平均数,偏态数据用

中位数,若缺失值较多需考虑其他方法。

6.以下哪个指标可用于衡量数据分布的离散程度?()

A.中位数

B.约数

C.标准差

D.偏度系数

【答案】C【解析】标准差是衡量数据波动性的常用指标,值越大表示数据离散程度越

高。

7.在散点图中,如果所有数据点近似呈一条直线,则说明两个变量()

A.无相关关系

B.相关性较弱

C.线性正相关

D.线性负相关

【答案】C【解析】数据点呈直线表示变量间存在线性关系,且斜率为正时为线性正相

关。

8.Excel中函数=IF(A110,高,低)的功能是()

A.判断A1是否大于10

B.若A110返回高,否则返回低

C.计算10与A1的差值

D.将A1单元格内容转换为数字

【答案】B【解析】IF函数根据条件判断结果返回不同值,此函数在A110时返回高,

否则返回低。

9.以下哪种图表最适合展示部分与整体的关系?()

A.散点图

B.柱状图

C.饼图

D.折线图

【答案】C【解析】饼图通过切片占比直观展示各部分占总体的比例,适用于分类数据

的占比分析。

10.在Python中,使用pandas处理数据时,读取CSV文件的常用函数是()

A.read_excel()

B.read_sql()

C.read_csv()

D.read_json()

【答案】C【解析】pandas中的read_csv()函数用于读取CSV格式数据,其他选项分别

用于处理Excel、SQL和JSON数据。

二、多选题(每题4分,共20分)

1.以下哪些方法可用于数据清洗?()

A.处理缺失值

B.检测并修正异常值

C.统一数据格式

D.删除重复数据

E.对数据重新编码

【答案】A、B、C、D【解析】数据清洗包括缺失值处理、异常值检测、格式统一和重复

数据删除,重新编码属于特征工程范畴。

2.在Excel中,以下哪些函数属于统计函数?()

A.COUNTIF()

B.SUM()

C.AVERAGE()

D.VLOOKUP()

E.MAX()

文档评论(0)

1亿VIP精品文档

相关文档