Python数据分析面试题及Pandas应用含答案.docxVIP

  • 1
  • 0
  • 约3.36千字
  • 约 8页
  • 2026-02-18 发布于福建
  • 举报

Python数据分析面试题及Pandas应用含答案.docx

第PAGE页共NUMPAGES页

2026年Python数据分析面试题及Pandas应用含答案

一、选择题(每题2分,共10题)

1.在Pandas中,以下哪个函数用于按指定列的值对DataFrame进行分组并计算统计量?

A.`merge()`

B.`groupby()`

C.`pivot()`

D.`concat()`

2.若DataFrame`df`包含列`date`(字符串类型),如何将其转换为Pandas的`Timestamp`类型?

A.`pd.to_datetime(df[date],errors=coerce)`

B.`df[date].astype(datetime64)`

C.`pd.strptime(df[date],%Y-%m-%d)`

D.以上均不正确

3.在Pandas中,如何检查DataFrame中是否存在缺失值?

A.`df.isnull().sum()`

B.`df.isna().any()`

C.`df.isnan().sum()`

D.以上均不正确

4.以下哪个方法可以用来删除DataFrame中的重复行?

A.`df.drop_duplicates()`

B.`df.unique()`

C.`df.dropna()`

D.`df.duplicated()`

5.若需对DataFrame的某列进行归一化处理(0-1范围),以下哪个方法最合适?

A.`df[col]/df[col].max()`

B.`scikit-learn.preprocessing.MinMaxScaler()`

C.`df[col].apply(lambdax:(x-df[col].min())/(df[col].max()-df[col].min()))`

D.以上均不正确

二、填空题(每空2分,共5题)

6.在Pandas中,使用___________函数可以将两个DataFrame按行或列进行拼接。

7.若需筛选出DataFrame中`salary`列大于50000的行,应使用___________条件。

8.使用___________方法可以计算DataFrame中所有数值列的均值。

9.在Pandas中,___________函数用于将Series转换为DataFrame。

10.若需对DataFrame的某列按自定义规则排序,应使用___________参数。

三、简答题(每题10分,共3题)

11.简述Pandas中`merge()`函数的常用参数及其作用。

12.如何处理DataFrame中的缺失值?请列举三种方法并说明适用场景。

13.在金融数据分析中,如何使用Pandas计算股票的移动平均线(MA)?请给出代码示例。

四、编程题(每题20分,共2题)

14.数据清洗任务:

给定以下DataFrame`df`:

python

importpandasaspd

data={name:[张三,李四,王五,None],age:[25,30,None,28],salary:[5000,7000,6500,6000]}

df=pd.DataFrame(data)

请完成以下任务:

-删除`name`列中的缺失值。

-将`age`列的缺失值填充为该列的中位数。

-为`salary`列添加一个新列`bonus`,计算奖金(奖金=工资的10%)。

-按年龄降序排列,并输出前两行数据。

15.数据分析任务:

给定以下DataFrame`df`,包含某股票的每日收盘价和交易量:

python

data={date:[2023-01-01,2023-01-02,2023-01-03,2023-01-04],

close:[100,102,101,105],

volume:[500,600,450,700]}

df=pd.DataFrame(data)

df[date]=pd.to_datetime(df[date])

请完成以下任务:

-计算过去3天的移动平均收盘价(MA3)。

-筛选出交易量大于500的日期,并按交易量降序排列。

-计算收盘价涨跌幅(当日收盘价-前一日收盘价),并添加到新列`change`。

答案与解析

一、选择题答案

1.B

解析:`groupby()`函数用于分组统计,是数据分析中的常用操作。

2.A

解析:`pd.to_datetime()`可将字符串转换为`Timestamp`,`errors=coerce`将无效格式转换为NaT。

3.A

解析:`df.isnull().sum

文档评论(0)

1亿VIP精品文档

相关文档