总结了pandas提取数据的种方法,统统只需行代码,真香!.docxVIP

总结了pandas提取数据的种方法,统统只需行代码,真香!.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
总结了pandas提取数据的15种方法,统统只需1行代码,真香! ①第一种方法,用比较运算符‘==’: data[data.门店编号==CDXL] ②其次种方法,用比较函数eq: data[data[门店编号].eq(CDXL)] 2.筛选单价小于等于10元的运营数据 ③第一种方法,用比较运算符‘=’: data[data.单价=10] ④其次种方法,用比较函数le: data[data[单价].le(10)] 3.筛选销量大于2000的运营数据 ⑤第一种方法,用比较运算符‘=’: data[data.销量2] ⑥其次种方法,用比较函数ge: data[data[销量].ge(2)] 4.筛选除门店CDXL外的运营数据 ⑦第一种方法,用比较运算符‘!=’: data[data.门店编号!=CDXL] ⑧其次种方法,用比较函数ne: data[data[门店编号].ne(CDXL)] 5.筛选2021年5月的运营数据 首先将日期格式化: data[日期]=data[日期].values.astype(datetime64)??#假如已为日期格式则此步骤可省略 data[日期] import?datetime s_date?=?datetime.datetime.strptime(2021-04-30,?%Y-%m-%d).date()??#起始日期 e_date?=?datetime.datetime.strptime(2021-06-01,?%Y-%m-%d).date()??#结束日期 ⑨第一种方法,用规律运算符号 和: Pandasdatetime64[ns]不能直接与datetime.date相比,需要用pd.Timestamp进行转化 data[(data.日期pd.Timestamp(s_date))(data.日期 ⑩其次种,用比较函数gtlt和: data[(data[日期].lt(pd.Timestamp(e_date)))(data[日期].gt(pd.Timestamp(s_date)))] ?第三种,用apply函数实现: id_a=data.日期.apply(lambda?x:?x.year?==2021??and?x.month==5) data[id_a] ?第四种,用between函数实现: id_b=data.日期.between(pd.Timestamp(s_date),pd.Timestamp(e_date)) data[id_b] 6.筛选“类别ID”包含000的数据 ?第一种,用contains函数: data[类别ID]=data[类别ID].values.astype(str)??#将该列转换为字符数据类型 id_c=data.类别ID.str.contains(000,na=False) data[id_c] ?其次种,用isin函数: id_i=data.类别ID.isin([000])??#接受一个列表 data[id_i] 很圆满,isin函数搞不定,由于它只能推断该列中元素能否在列表中 7.筛选商品ID以“301”开头的运营数据 ?需要用contains函数结合正则表达式使用: data[商品ID]=data[商品ID].values.astype(str)??#将该列转换为字符数据类型 id_c2=data.商品ID.str.contains(301\d{5},na=False) data[id_c2] 假如觉得文章写的不错,请点个“在看”支持一下鸟哥! -----------

文档评论(0)

liuxiyuliuxingyu + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档