- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据分析常用函数速查与实例工具表
引言
在数据分析工作中,函数是提升效率的核心工具。无论是数据清洗、统计分析还是结果可视化,熟练运用常用函数能快速解决实际问题。本工具表整合了Excel、Python(pandas库)中高频数据分析函数,结合具体使用场景和操作步骤,帮助、等数据分析从业者快速上手,避免重复试错。
一、这些函数能帮你解决什么问题?
1.数据清洗:快速规范原始数据
问题场景:原始数据存在重复值、缺失值、格式错误(如日期格式不统一、文本含多余空格),需快速清理。
适用函数:Excel的TRIM、SUBSTITUTE、IFERROR;Python的drop_duplicates()、fillna()、replace()。
2.数据计算:高效统计关键指标
问题场景:需计算销售额总和、平均值、同比增长率,或按条件筛选数据(如“某区域销售额超过10万的订单”)。
适用函数:Excel的SUMIFS、AVERAGEIFS、IF;Python的group()、sum()、pct_change()。
3.数据匹配:关联多表信息
问题场景:从“员工信息表”匹配“销售业绩表”的部门名称,或从“产品库”提取产品单价到“订单表”。
适用函数:Excel的VLOOKUP、INDEX+MATCH;Python的merge()、map()。
4.日期处理:拆分或计算时间差
问题场景:从“订单日期”提取年/月,计算“订单到账周期”,或筛选“近30天”的订单数据。
适用函数:Excel的YEAR、DATEDIF、TODAY;Python的pd.to_datetime()、dt.year、timedelta。
二、函数使用分步指南(附实例)
【Excel示例1】用VLOOKUP匹配员工部门
场景:已知“员工工号-姓名”表(Sheet1),需从“部门信息表”(Sheet2)中匹配部门名称,填充到Sheet1的“部门”列。
步骤1:准备数据
Sheet1数据:A列(工号)、B列(姓名),C列需填充“部门”。
Sheet2数据:D列(工号)、E列(部门),工号列无重复且为文本格式。
步骤2:输入公式
在Sheet1的C2单元格输入:
excel
=VLOOKUP(A2,Sheet2!D:E,2,FALSE)
参数说明:
A2:查找值(当前员工的工号);
Sheet2!D:E:查找区域(包含工号和部门的列,工号必须为第一列);
2:返回列索引(从查找区域第一列开始数,部门在第2列);
FALSE:精确匹配(保证工号完全一致)。
步骤3:填充公式
拖拽C2单元格右下角填充柄,至所有员工数据行。
结果验证
若A2工号为“1001”,Sheet2中D列“1001”对应E列为“销售部”,则C2显示“销售部”;若工号不存在,返回#N/A。
【Python示例1】用pandas.merge合并销售数据
场景:已知“订单表”(df1,含订单ID、客户ID、销售额)和“客户信息表”(df2,含客户ID、客户名称、区域),需合并两张表,添加客户名称和区域信息。
步骤1:导入库并创建数据
importpandasaspd
订单表
df1=pd.DataFrame({
‘订单ID’:[‘A001’,‘A002’,‘A003’],
‘客户ID’:[‘C01’,‘C02’,‘C01’],
‘销售额’:[1200,800,1500]
})
客户信息表
df2=pd.DataFrame({
‘客户ID’:[‘C01’,‘C02’,‘C03’],
‘客户名称’:[‘张公司’,’李店铺’,’王*工厂’],
‘区域’:[‘华东’,‘华南’,‘华北’]
})
步骤2:执行合并操作
df_merge=pd.merge(df1,df2,on=‘客户ID’,how=‘left’)
参数说明:
on=客户ID:合并依据的列名(两张表共有的列);
how=left:左连接(保留df1所有订单,若客户ID在df2中不存在,则对应列填充NaN)。
步骤3:查看结果
print(df_merge)
输出结果:
订单ID客户ID销售额客户名称区域
0A001C011200张*公司华东
1A002C02800李*店铺华南
2A003C011500张*公司华东
三、常用函数速查与实例对照表
函数名称
所属工具
功能描述
语法结构/参数示例
实例数据及结果
适用场景
VLOOKUP
Excel
列方向查找并返回对应值
=VLOOKUP(查找值,区域,列索引,[匹配类型])
查找工号“1001”对应部门:=VLOOKUP(1001,D:E,2,FALSE)→返回“销售部”
单列匹配、跨表关联
SU
您可能关注的文档
最近下载
- 计谋大全-3个108计.pdf VIP
- 2024-2025学年江苏省苏州市昆山市、太仓市、常熟市、张家港市八年级(上)期末历史试卷.pdf VIP
- GZ-2022060 英语口语赛项规程.pdf VIP
- 国开02363_11717护理伦理学-机考复习资料.pdf
- 黑龙江省高校羽毛球俱乐部发展现状及对策研究-体育专业论文.docx VIP
- 《320排容积CT一站式三联检查在急性胸痛诊断中的应用》.docx VIP
- 320排容积CT一站式三联检查在急性胸痛诊断中的运用.pdf VIP
- 320排容积CT一站式三联检查在急性胸痛诊断中的应用的开题报告.docx VIP
- 《儿童心电图解读》课件.ppt VIP
- 新大学俄语简明教程蒋财珍课后习题答案解析.pdf
原创力文档


文档评论(0)