数据科学家的面试技能与测试重点.docxVIP

  • 0
  • 0
  • 约6.96千字
  • 约 19页
  • 2026-02-03 发布于福建
  • 举报

第PAGE页共NUMPAGES页

2026年数据科学家的面试技能与测试重点

一、编程能力测试(共5题,每题10分,总分50分)

题目1(Python编程能力测试,10分)

题目:

请编写一个Python函数,实现以下功能:

1.输入一个包含多个字符串的列表,其中每个字符串可能包含数字和字母。

2.函数返回一个新列表,其中仅包含原列表中所有字符串都包含至少一个数字的字符串。

3.输出的新列表中的字符串按数字出现的次数降序排列,若数字出现次数相同,则按字符串原顺序排列。

示例输入:

python

input_list=[abc,a1b2c3,123,xyz,a1b,12c]

示例输出:

python

[a1b2c3,12c,123]

答案:

python

deffilter_strings_with_digits(input_list):

defcount_digits(s):

returnsum(c.isdigit()forcins)

filtered=[sforsininput_listifany(c.isdigit()forcins)]

filtered.sort(key=lambdax:(-count_digits(x),input_list.index(x)))

returnfiltered

示例输入

input_list=[abc,a1b2c3,123,xyz,a1b,12c]

示例输出

print(filter_strings_with_digits(input_list))

解析:

1.过滤逻辑:使用列表推导式检查每个字符串是否至少包含一个数字,通过`any(c.isdigit()forcins)`实现。

2.排序逻辑:

-首先按数字出现次数降序排列(`-count_digits(x)`)。

-若数字次数相同,则按原列表顺序排列(`input_list.index(x)`作为次要排序键)。

3.效率考虑:避免重复计算数字次数,通过`count_digits`函数缓存结果。

题目2(Pandas数据处理能力测试,10分)

题目:

假设有一个CSV文件`sales_data.csv`,包含以下列:

-`date`(日期,格式为`YYYY-MM-DD`)

-`region`(销售区域,如华东、华南、华北)

-`product`(产品名称)

-`sales`(销售额)

请编写Python代码完成以下任务:

1.读取CSV文件,并将`date`列转换为`datetime`类型。

2.计算每个区域的销售额总和,并按总和降序排列。

3.添加一个新列`month`,提取`date`列的月份。

4.返回前5条销售最高的记录(按`sales`列降序排列)。

答案:

python

importpandasaspd

defprocess_sales_data(file_path):

df=pd.read_csv(file_path)

df[date]=pd.to_datetime(df[date])

df[month]=df[date].dt.month

region_sales=df.groupby(region)[sales].sum().sort_values(ascending=False)

top_sales=df.sort_values(sales,ascending=False).head(5)

returntop_sales

示例调用(假设文件路径正确)

print(process_sales_data(sales_data.csv))

解析:

1.日期处理:使用`pd.to_datetime`确保`date`列为日期类型,便于后续计算。

2.区域汇总:`groupby`按`region`分组,`sum`计算销售额,`sort_values`降序排列。

3.月份提取:`dt.month`从日期中提取月份。

4.排序与截取:`sort_values(sales,ascending=False)`和`head(5)`获取前5条最高销售额记录。

题目3(SQL查询能力测试,10分)

题目:

假设有一个数据库表`employees`,包含以下列:

-`id`(员工ID,主键)

-`name`(姓名)

-`department`(部门)

-`salary`(薪资)

-`join_date`(入职日期,格式为`YYYY-MM-DD`)

请编写SQL查询,完成以下任务:

1.查询所有部门平均薪资高于公司平均薪资的部门名称及平均薪资。

2.查

文档评论(0)

1亿VIP精品文档

相关文档