人民大2024《大数据分析:基于Python》PPT第6章.pptx

人民大2024《大数据分析:基于Python》PPT第6章.pptx

  1. 1、本文档共46页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;Pandas是python中基于NumPy的数据分析工具,是一个强大的分析结构化数据的工具集。Pandas提供的数据结构具有处理数据灵活、速度快、富有表现力的特点,使得数据分析更加高效强大,因而广泛应用于金融、统计学、学术研究、工程等领域。

Anaconda平台默认已经安装了Pandas库,用户可以直接导入使用。常用的Pandas库导入命令为:

importpandasaspd

Pandas常用的有Series和DataFrame两2种数据结构。;6.1.1Series的创建

Series是一维数组序列,也称为序列,存储一行或一列数据。它由一组数据和相应的数据标签组成,数据标签也称为索引(index)。Series类似于NumPy中带标签的一维数组,不同的是该标签是“显性”的,但Series的索引不局限于整数,还可以自定义为字符串,如a、b、c、d,甚至是first、second、third等等,其默认的索引是从0开始的自然数。使用索引可以非常方便地在Series序列中取值。

(1)创建Series

Series对象使用pd.Series()函数创建,使用方式如下:

pd.Series(data,index,dtype)

其中:

data:序列数据,可以是list、dict或NumPy中一维ndarray数组。

index:序列索引(标签),可以用列表表示,默认为从0开始按1自动递增的整数索引。

dtype:序列的数据类型,默认根据data中的数据自动设置。

例如,分别通过list、dict和一维ndarray数组创建Series对象。;In[1]:importnumpyasnp

...:importpandasaspd

...:#直接给定列表创建序列series1

...:series1=pd.Series([45,12,56,24,35],

...:[a,b,c,d,e])

...:series1

Out[1]:

a45

b12

c56

d24

e35

dtype:int64

?

In[2]:lis=[60.5,1620,447,2890,345,1800,1970,37.8]

...:elem=[Ca,K,Fe,Cl,P,S,Na,Mg]

...:bld=pd.Series(lis,elem)#通过列表list1创建序列blood

...:bld

Out[2]:

Ca60.5

K1620.0

Fe447.0

Cl2890.0

P345.0

S1800.0

Na1970.0

Mg37.8

dtype:float64;In[1]:importpandasaspd

...:L_1=[aa,bb,cc,dd,ee]

...:s1=pd.Series(L_1)

...:s1

Out[1]:

0aa

1bb

2cc

3dd

4ee

dtype:object

?

In[2]:s1[3]

Out[2]:dd

?

;In[5]:s1[:3]

Out[5]:

0aa

1bb

2cc

dtype:object

?

In[6]:s1[::2]

Out[6]:

0aa

2cc

4ee

dtype:object

?

In[7]:s1[::-1]

Out[7]:

4ee

3dd

2cc

1bb

0aa

dtype:object;In[11]:s1[5]=ff#当索引号不存在时,则为增加该元素

?

In[12]:s1#再次查看,发现增加了原索引号不存在的元素ff

Out[12]:

0aa

1bb

2c2

3dd

4ee

5ff

dtype:object;In[14]:pd.concat([s1,s2])

Out[14]:

0aa

1bb

2c2

3dd

4ee

5ff

aaa

bbb

ccc

ddd

eee

dtype:object;s.index输出的是序列s的标签,也即索引。显示结果表示该标签为[A,B,C]。

所以可以直接对索引s.index赋值即可修改。;

您可能关注的文档

文档评论(0)

allen734901 + 关注
实名认证
内容提供者

知识共享

1亿VIP精品文档

相关文档