我用Python展示Excel中常用的个操作.docxVIP

下载本文档

12
0
约4.22千字
约 39页
2021-11-16 发布于湖南
举报
版权申诉

我用Python展示Excel中常用的个操作.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

我用Python呈现Excel中常用的20个操作 Excel与Python都是数据分析中常用的工具，本文将使用动态图(Excel)+代码(Python)的方式来演示这两种工具是如何实现数据的读取、生成、计算、修改、统计、抽样、查找、可视化、存储等数据处理中的常用操作！数据读取说明：读取本地Excel数据 Excel Excel读取本地数据需要打开目标文件夹选中该文件并打开 Pandas Pandas支持读取本地Excel、txt文件，也支持从网页直接读取表格数据，只用一行代码即可，例如读取上述本地Excel数据可以使用pd.read_excel(示例数据.xlsx) 数据生成说明：生成指定格式/数量的数据 Excel 以生成10*2的0—1均匀分布随机数矩阵为例，在Excel中需要使用rand()函数生成随机数，并手动拉取指定范围 Pandas 在Pandas中可以结合NumPy生成由指定随机数(均匀分布、正态分布等)生成的矩阵，例犹如样生成10*2的0—1均匀分布随机数矩阵为，使用一行代码即可：pd.DataFrame(np.random.rand(10,2)) 数据存储说明：将表格中的数据存储至本地 Excel 在Excel中需要点击保存并设置格式/文件名 Pandas 在Pandas中可以使用pd.to_excel(filename.xlsx)来将当前工作表格保存至当前名目下，当然也可以使用to_csv保存为csv等其他格式，也可以使用确定路径来指定保存位置数据筛选说明：依据指定要求筛选数据 Excel 使用我们之前的示例数据，在Excel中筛选出薪资大于5000的数据步骤如下 Pandas 在Pandas中，可直接对数据框进行条件筛选，例犹如样进行单个条件(薪资大于5000)的筛选可以使用df[df[薪资水平]5000]，假如使用多个条件的筛选只需要使用(并)与|(或)操作符实现数据插入说明：在指定位置插入指定数据 Excel 在Excel中我们可以将光标放在指定位置并右键添加一行/列，当然也可以在添加时对数据进行一些计算，比如我们就可以使用IF函数(=IF(G210000,高,低))，将薪资大于10000的设为高，低于10000的设为低，添加一列在最终 Pandas 在pandas中，假如不借助自定义函数的话，我们可以使用cut方法来实现同样操作 bins?=?[0,10000,max(df[薪资水平])]group_names?=?[低,高]df[new_col]?=?pd.cut(df[薪资水平],?bins,?labels=group_names) 数据删除说明：删除指定行/列/单元格 Excel 在Excel删除数据格外简约，找到需要删除的数据右键删除即可，比如删除刚刚生成的最终一列 Pandas 在pandas中删除数据也很简约，比如删除最终一列使用del df[new_col]即可数据排序说明：依据指定要求对数据排序 Excel 在Excel中可以点击排序按钮进行排序，例如将示例数据依据薪资从高到低进行排序可以依据下面的步骤进行 Pandas 在pandas中可以使用sort_values进行排序，使用ascending来把握升降序，例如将示例数据依据薪资从高到低进行排序可以使用df.sort_values(薪资水平,ascending=False,inplace=True) 缺失值处理说明：对缺失值(空值)依据指定要求处理 Excel 在Excel中可以依据查找—定位条件—空值来快速定位数据中的空值，接着可以本人定义缺失值的填充方式，比如将缺失值用上一个数据进行填充 Pandas 在pandas中可以使用data.isnull().sum()来检查缺失值，之后可以使用多种方法来填充或者删除缺失值，比如我们可以使用df = df.fillna(axis=0,method=ffill)来横向/纵向用缺失值前面的值替换缺失值数据去重说明：对反复值依据指定要求处理 Excel 在Excel中可以通过点击数据—删除反复值按钮并选择需要去重的列即可，例如对示例数据依据创建时间列进行去重，可以发觉去掉了196 个反复值，保留了 629 个独一值。 Pandas 在pandas中可以使用drop_duplicates来对数据进行去重，并且可以指定列以及保留挨次，例如对示例数据依据创建时间列进行去重df.drop_duplicates([创建时间],inplace=True)，可以发觉和Excel处理的结果全都，保留了?629?个独一值。格式修改说明：修改指定数据的格式 Excel 在Excel中可以选中需要转换格式的数据之后右键—修改单元格格式来选择我们需要的格式 Pandas