实验9 Pandas常用操作.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Pandas常用操作实验九

课程学习目标掌握Pandas的两个核心数据结构掌握Pandas常用数据处理方法了解数据可视化

Pandas数据导入Pandas支持非常丰富的文件类型,它可以读取和保存多种类型的数据。导入Excel数据Excel数据常常导入的是.xls或.xlsx文件。pd.read_excel(io,sheet_name,header)io:表示.xls或.xlsx的文件路径或类文件对象,必须是文件的真实路径;sheet_name:表示工作表;header:默认值为0,取第一行的值为列名,数据为除列名以外的数据,如果数据不包含列名,则设置header=None。

Pandas数据导入例9.1导入Excel数据。importpandasaspd#导入Excel数据data=pd.read_excel(rC:\Users\JOLY\Desktop\test.xlsx,sheet_name=0,header=0)print(data)导入Excel数据

Pandas数据导入filepath_or_buffer:字符串、文件路径,也可以是URL链接;sep:每行数据内容的分隔符号,CSV中常用’,’分隔;header:指定作为列名的行,默认值为0,即取第一行的值为列名。数据为除列名以外的数据,若数据不包含列表,则设置header=None;names:用来指定列的名称,类似于列表的序列,不允许有重复值;usecols:用来获取指定列名的数据;skip_blank_lines:跳过指定行数;nrows:用于指定需要读取的行数,常用于较大的数据;encoding:字符串,默认值为None,文件的编码格式。导入CSV文件pd.read_csv(filepath_or_buffer,sep=,header,encoding=None)除了Excel文件,CSV文件是Pandas另一种重要文件形式,CSV可用记事本打开。

Pandas数据导入例9.2使用read_csv()函数导入CSV文件。importpandasaspddf=pd.read_csv(rC:\Users\JOLY\Desktop\los_census.csv,sep=,,encoding=utf-8)pd.set_option(display.unicode.east_asian_width,True)#规则格式print(df)导入CSV文件

Pandas数据导入io:字符串、文件路径,也可以是URL链接,网址不接受https;match:正则表达式;flavor:解释器,默认为’lxml’;header:指定列标题所在的行;encoding:文件的编码格式。注意:导入HTML网页数据时只能导入table标签的数据。导入HTML网页pd.read_html(io,match=.+,flavor,header,encoding)

Pandas数据导入例9.3使用read_html()函数导入HTML网页。importpandasaspdurl=/nba/salaries#pd.read_html返回的是一个DataFrame的列表,我们选择其中一个DataFramedf_list=pd.read_html(url,header=0)#如果有多个DataFrame,可以选择其中一个,或者合并多个DataFramedf=df_list[0]print(df)#将数据保存到CSV文件,确保文件名合法df.to_csv(nba_player_salaries.csv,index=False)导入HTML网页

Pandas数据操作通过上面内容,可知一个DataFrame结构大致由三部分组成,分别是列名称、索引和数据。接下来学习针对DataFrame的基本操作,这里不会刻意强调Series,因为前面在DataFrame上学习的大多数方法和技巧都适用于对Series进行处理,在例9.3中已经读取了一个外部数据,这是洛杉矶的人口普查数据。有些时候,读取的文件很大。如果全部输出预览这些文件,既不美观,又很耗时。Pandas提供了head()和tail()方法,它可以帮助用户只预览一小块数据。

Pandas数据操作例9.4使用df.head()函数预览前五条数据。importpandasaspddf=pd.read_csv(rC:\Users\JOLY\Desktop\los_census.csv,sep=,,encoding=utf-8)pd.set_option(display.unicode.east_asian_width,True)#规则格式print(df.he

您可能关注的文档

文档评论(0)

弹弹 + 关注
实名认证
文档贡献者

人力资源管理师、教师资格证持证人

该用户很懒,什么也没介绍

版权声明书
用户编号:6152114224000010
领域认证该用户于2024年03月13日上传了人力资源管理师、教师资格证

1亿VIP精品文档

相关文档