Pandas多个条件(AND,OR,NOT)中提取行.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

Pandas多个条件(AND,OR,NOT)中提取行

目录如何提取(选择)行通过AND,OR,NOT多个条件提取(选择)行的代码-示例3个以上条件的运算符的优先级使用Pandas从多个条件(AND,OR,NOT)中提取行的方法。

有以下2点需要注意:

&,|,?的使用(and、or、not的错误)使用比较运算符时,请将每个条件括在括号中。

以下数据为例。

importpandasaspd

df=pd.read_csv(./data/09/sample_pandas_normal.csv)

print(df)

#???name?agestate?point

#0??Alice?24??NY??64

#1???Bob?42??CA??92

#2?Charlie?18??CA??70

#3??Dave?68??TX??70

#4??Ellen?24??CA??88

#5??Frank?30??NY??57

本例是使用pandas.DataFrame,但pandas.Series也同样适用。

如何提取(选择)行

首先,展示如何从pandas.DataFrame中提取(选择)行以获得新的pandas.DataFrame。

使用布尔列表(数组)或pandas.Series,只能提取(选择)True行。

mask=[True,False,True,False,True,False]

df_mask=df[mask]

print(df_mask)

#nameagestatepoint

#0Alice24NY64

#2Charlie18CA70

#4Ellen24CA88

通过AND,OR,NOT多个条件提取(选择)行的代码-示例

具有两个条件值的pandas.Series,可以使用&获得如下结果。在这里,为了便于说明,将==和?用作二个条件,但是仅使用!=也是可以。

print(df[age]35)

#0??True

#1??False

#2??True

#3??False

#4??True

#5??True

#Name:age,dtype:bool

print(~(df[state]==NY))

#0??False

#1??True

#2??True

#3??True

#4??True

#5??False

#Name:state,dtype:bool

print((df[age]35)~(df[state]==NY))

#0??False

#1??False

#2??True

#3??False

#4??True

#5??False

#dtype:bool

仅提取(选择)True行。

df_and=df[(df[age]35)~(df[state]==NY)]

print(df_and)

#nameagestatepoint

#2Charlie18CA70

#4Ellen24CA88

对于OR也是如此。使用|。

print((df[age]20)|(df[point]90))

#0??False

#1??True

#2??True

#3??False

#4??False

#5??False

#dtype:bool

df_or=df[(df[age]20)|(df[point]90)]

print(df_or)

#???name?agestate?point

#1???Bob?42??CA??92

#2?Charlie?18??CA??70

3个以上条件的运算符的优先级

运算符的优先级是NOT(?),AND(&),OR(|)。因此,结果因顺序而异。

df_multi_1=df[(df[age]35)|~(df[state]==NY)(df[point]75)]

print(df_multi_1)

#???name?agestate?point

#0??Alice?24??NY??64

#2?Charlie?18??CA??70

#3??D

文档评论(0)

184****8785 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档