Python数据分析入门教程(一):获取数据源.pdfVIP

  • 0
  • 0
  • 约2.22万字
  • 约 16页
  • 2026-03-16 发布于河北
  • 举报

Python数据分析入门教程(一):获取数据源.pdf

作者|CDA数据分析师

俗话说,巧妇难为无米之炊。不管你厨艺有多好,如果没有食,也做不出香甜可L的饭菜

来,所以想要做出饭菜来,首先要做的就是要买米买菜。而数据分析就好比是做饭,首先也

应该是准备食,也就是获取数据源。

一、导入外部数据

导入数据主要用到的是Pandas里的rcad_x(方)法,x表示待导入文件的格式。

1、导入.xlsx文件

在Excel中导入.xlsx格式的文件时很简单的,双击打开就可以了。在Pylhon中导入.xlsx文件

的是read_ex81这0种方法。

(1)基本导入

在导入文件的时候首先要指定文件的路径,也就是这个文件在电脑中的哪个文件夹下存放着。

pandasaspd

df-pd.readexcel(r*C:\Users\zhangjunhongXDesktop\test.xlsx**)

df

编号年龄性别注册时间

0A154男2018-08-08

1A216女2018-08-09

2A347女2018-08-10

3A441男2018-08-11

电脑中的文件路径默认是使用的,这个时候需要在路径前面加一个r(转义符)避免路径里

面的被转义。也可以不加转义符r,但是需要把路径里面所有的转换成/,这个规则在导入其

他格式文件的时候也是一样的,我们普通会选择在路径前面加转义符r。

・路校前面不加r

df■pd.readexcel(C:/Users/zhangjunhong/Desktop/test.xlsx)

df

编号年龄性别注册时间

0A154叼2018-08-08

1A21女2018-08-09

2A347女2019-08-10

3A441男2013-08-11

(2)指定导入哪个Sheel

.xlsx格式的文件可以有不少个Sheet,你可以通过设定shcet_name参数来指定要导入哪个

Sheet的文件。

»df-pd.read_excel(WC:/Users/zhangjunhong/Desktop/test.xlsxH,

sheetname-MSheet1M)

»df

编号年龄性别注册时间

0A154男2018-08-08

1A21女2018-08-09

2A347女2018-08-10

3A441男2018-08-11

除了可以指定具体Sheet的名字,还可以传入Sheet的顺序,从。开始计数。

df-pd.read_excel(WC:/Users/zhangjunhong/Desktop/test.xlax*,

she

文档评论(0)

1亿VIP精品文档

相关文档