数据分析常用函数速查与实例工具表.docVIP

数据分析常用函数速查与实例工具表.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据分析常用函数速查与实例工具表

引言

在数据分析工作中,函数是提升效率的核心工具。无论是数据清洗、统计分析还是结果可视化,熟练运用常用函数能快速解决实际问题。本工具表整合了Excel、Python(pandas库)中高频数据分析函数,结合具体使用场景和操作步骤,帮助、等数据分析从业者快速上手,避免重复试错。

一、这些函数能帮你解决什么问题?

1.数据清洗:快速规范原始数据

问题场景:原始数据存在重复值、缺失值、格式错误(如日期格式不统一、文本含多余空格),需快速清理。

适用函数:Excel的TRIM、SUBSTITUTE、IFERROR;Python的drop_duplicates()、fillna()、replace()。

2.数据计算:高效统计关键指标

问题场景:需计算销售额总和、平均值、同比增长率,或按条件筛选数据(如“某区域销售额超过10万的订单”)。

适用函数:Excel的SUMIFS、AVERAGEIFS、IF;Python的group()、sum()、pct_change()。

3.数据匹配:关联多表信息

问题场景:从“员工信息表”匹配“销售业绩表”的部门名称,或从“产品库”提取产品单价到“订单表”。

适用函数:Excel的VLOOKUP、INDEX+MATCH;Python的merge()、map()。

4.日期处理:拆分或计算时间差

问题场景:从“订单日期”提取年/月,计算“订单到账周期”,或筛选“近30天”的订单数据。

适用函数:Excel的YEAR、DATEDIF、TODAY;Python的pd.to_datetime()、dt.year、timedelta。

二、函数使用分步指南(附实例)

【Excel示例1】用VLOOKUP匹配员工部门

场景:已知“员工工号-姓名”表(Sheet1),需从“部门信息表”(Sheet2)中匹配部门名称,填充到Sheet1的“部门”列。

步骤1:准备数据

Sheet1数据:A列(工号)、B列(姓名),C列需填充“部门”。

Sheet2数据:D列(工号)、E列(部门),工号列无重复且为文本格式。

步骤2:输入公式

在Sheet1的C2单元格输入:

excel

=VLOOKUP(A2,Sheet2!D:E,2,FALSE)

参数说明:

A2:查找值(当前员工的工号);

Sheet2!D:E:查找区域(包含工号和部门的列,工号必须为第一列);

2:返回列索引(从查找区域第一列开始数,部门在第2列);

FALSE:精确匹配(保证工号完全一致)。

步骤3:填充公式

拖拽C2单元格右下角填充柄,至所有员工数据行。

结果验证

若A2工号为“1001”,Sheet2中D列“1001”对应E列为“销售部”,则C2显示“销售部”;若工号不存在,返回#N/A。

【Python示例1】用pandas.merge合并销售数据

场景:已知“订单表”(df1,含订单ID、客户ID、销售额)和“客户信息表”(df2,含客户ID、客户名称、区域),需合并两张表,添加客户名称和区域信息。

步骤1:导入库并创建数据

importpandasaspd

订单表

df1=pd.DataFrame({

‘订单ID’:[‘A001’,‘A002’,‘A003’],

‘客户ID’:[‘C01’,‘C02’,‘C01’],

‘销售额’:[1200,800,1500]

})

客户信息表

df2=pd.DataFrame({

‘客户ID’:[‘C01’,‘C02’,‘C03’],

‘客户名称’:[‘张公司’,’李店铺’,’王*工厂’],

‘区域’:[‘华东’,‘华南’,‘华北’]

})

步骤2:执行合并操作

df_merge=pd.merge(df1,df2,on=‘客户ID’,how=‘left’)

参数说明:

on=客户ID:合并依据的列名(两张表共有的列);

how=left:左连接(保留df1所有订单,若客户ID在df2中不存在,则对应列填充NaN)。

步骤3:查看结果

print(df_merge)

输出结果:

订单ID客户ID销售额客户名称区域

0A001C011200张*公司华东

1A002C02800李*店铺华南

2A003C011500张*公司华东

三、常用函数速查与实例对照表

函数名称

所属工具

功能描述

语法结构/参数示例

实例数据及结果

适用场景

VLOOKUP

Excel

列方向查找并返回对应值

=VLOOKUP(查找值,区域,列索引,[匹配类型])

查找工号“1001”对应部门:=VLOOKUP(1001,D:E,2,FALSE)→返回“销售部”

单列匹配、跨表关联

SU

文档评论(0)

187****9041 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档