Python正则表达式由浅入深(一).docxVIP

  • 2
  • 0
  • 约4.3千字
  • 约 7页
  • 2020-04-15 发布于贵州
  • 举报
PAGE 2 Python正则表达式由浅入深(一) 数据分析工作中很多任务是跟文本处理相关,比如从文本中提取客户的信息,从文本中提取时间等等都是比较常见的操作。 虽然Python处理字符串的方法很多,而且流行的pandas库也提供了大量的向量化字符串方法,但是一旦涉及要经过较为复杂的数据匹配才能进行的字符操作,这些方法就显得非常的乏力。 尤其是由于文本数据来源于爬虫等渠道,数据往往严重不规整,这时候文本处理起来就显得尤为吃力。 幸运的是Python提供了re模块,可以实现正则表达式的操作。re模块主要通过六大方法来对字符串进行处理,包括:match()、search()、findall()、split()、sub()。 这些方法涉及到字符串的匹配与替换等操作,在接下来的4篇连载文章里,我们不单只会讲解这4种方法,还会把元字符、行定位符、限定符、字符类、排除字符、选择字符、转义字符、分组等正则表达式最常用知识点贯穿起来。 接下来的系列文章将会为大家初步搭建较为完整的Python正则表达式知识体系,如果你已经学习完Python编程基础和数据清洗的课程知识,该系列文章将会让你对使用Python正则表达式达到一学就会,一用就懂的技能熟悉程度,实现真正的融会贯通的目的。 re.match方法 我们首先看re模块中较为简单的match()方法。 match 的作用是利用 Pattern

文档评论(0)

1亿VIP精品文档

相关文档