- 1
- 0
- 约5.26千字
- 约 12页
- 2026-02-16 发布于福建
- 举报
第PAGE页共NUMPAGES页
2026年数据分析师面试中常见的编程题集含答案
1.Python基础与数据处理(共5题,总分25分)
题目1(5分):
用Python代码读取`data.csv`文件(包含`id`,`name`,`age`,`salary`四列),筛选出年龄大于30岁且薪资高于5000元的员工,并按薪资降序排列,输出前10条记录。
答案:
python
importpandasaspd
df=pd.read_csv(data.csv)
filtered_df=df[(df[age]30)(df[salary]5000)]
sorted_df=filtered_df.sort_values(by=salary,ascending=False).head(10)
print(sorted_df)
解析:
-`pd.read_csv`读取CSV文件。
-条件筛选使用布尔索引`df[(condition1)(condition2)]`。
-`sort_values`按指定列降序排序,`head(10)`取前10行。
题目2(5分):
给定列表`data=[10,20,30,None,50,60,None]`,用Python代码计算非空值的中位数。
答案:
python
importnumpyasnp
data=[10,20,30,None,50,60,None]
filtered_data=[xforxindataifxisnotNone]
median=np.median(filtered_data)
print(median)#输出:35.0
解析:
-列表推导式过滤`None`值。
-`np.median`计算中位数,忽略空值。
题目3(5分):
用Python代码创建一个10行3列的DataFrame,列名分别为`A`,`B`,`C`,数据为随机整数(范围1-100)。
答案:
python
importpandasaspd
importnumpyasnp
data=np.random.randint(1,101,size=(10,3))
df=pd.DataFrame(data,columns=[A,B,C])
print(df)
解析:
-`np.random.randint`生成随机整数矩阵。
-`pd.DataFrame`创建DataFrame并命名列。
题目4(5分):
用Python代码统计`data.csv`中`salary`列的空值数量,并填充空值为该列的平均值。
答案:
python
importpandasaspd
df=pd.read_csv(data.csv)
null_count=df[salary].isnull().sum()
df[salary]=df[salary].fillna(df[salary].mean())
print(f空值数量:{null_count})
解析:
-`isnull().sum()`统计空值数量。
-`fillna`用平均值填充空值。
题目5(5分):
用Python代码将`data.csv`的`name`列转换为小写,并保存为新的CSV文件`processed_data.csv`。
答案:
python
importpandasaspd
df=pd.read_csv(data.csv)
df[name]=df[name].str.lower()
df.to_csv(processed_data.csv,index=False)
解析:
-`str.lower()`将字符串列转换为小写。
-`to_csv`保存文件,`index=False`不写入行索引。
2.SQL查询(共4题,总分20分)
题目1(5分):
表结构:
-`employees`(`id`,`name`,`department`,`salary`)
-`departments`(`id`,`dept_name`)
关联查询:查询各部门平均薪资,仅显示平均薪资高于2000元的部门名称及平均薪资。
答案:
sql
SELECTd.dept_name,AVG(e.salary)ASavg_salary
FROMemployeese
JOINdepartmentsdONe.department=d.id
GROUPBYd.dept_name
HAVINGAVG(e.salary)2000;
解析:
-`JOIN`连接`emp
您可能关注的文档
- 2026年产品知识与销售知识考试题库.docx
- 2026年制药公司市场部经理考核问题详解.docx
- 2026年游戏服务器后台系统管理员面试题目集.docx
- 2026年基于机器学习的系统算法工程师面试题集.docx
- 2026年教育行业数据分析岗位招聘常见问题解答.docx
- 银行分行长面试题及答案.docx
- 2026年兵装集团品牌经理面试题集.docx
- 财务分析职位面试常见题集.docx
- 2026年造价工程师面试题集.docx
- 高级工程师面试题及答案物联网.docx
- 小学科学跨学科主题学习活动的设计研究教学研究课题报告.docx
- 人工智能辅助特殊教育领域学生个性化学习资源推荐策略研究教学研究课题报告.docx
- 基于人工智能的跨学科教学活动设计原则与实践路径研究教学研究课题报告.docx
- 小学信息技术教学评价创新:基于人工智能的视角教学研究课题报告.docx
- 初中音乐游戏化教学资源开发与音乐欣赏能力培养教学研究课题报告.docx
- 高中生借助化学传感器阵列与人工智能结合技术检测水果中防腐剂的含量的课题报告教学研究课题报告.docx
- 2026年智能音箱行业语音交互技术技术专利报告.docx
- (26页PPT)某房地产夏令营竞技体育亲子暖场活动策划方案.pptx
- 人工智能在高中生物教学中的应用与创新:教师培训体系探索教学研究课题报告.docx
- 足球文化在校园推广中的实践与效果评估教学研究课题报告.docx
最近下载
- (完整word版)仙剑奇侠传三图文攻略(最详细版).pdf VIP
- 2025年兰州工业学院软件工程专业《计算机网络》科目期末试卷及答案.docx VIP
- 苏S01-2012 给水排水图集.pdf
- 慢性阻塞性肺疾病急性加重围出院期管理与随访指南(2024年版).pptx VIP
- 公司行政办事指南.doc VIP
- 安墩珠湖萤矿场年开采 5 万吨萤石矿扩建项目环境影响报告.pdf
- 2024届秋季中国稀土集团启动校园招聘笔试参考题库附带答案详解.docx
- PLC运料小车控制系统设计.doc VIP
- 基于STM32单片机矿井矿工作业安全监测设计_成稿0419.doc VIP
- SL_T 276-2022 水文基础设施建设及技术装备标准(OCR).pdf VIP
原创力文档

文档评论(0)