Python正则表达式由浅入深（一）.docxVIP

下载本文档

2
0
约4.3千字
约 7页
2020-04-15 发布于贵州
举报

Python正则表达式由浅入深（一）.docx

PAGE 2 Python正则表达式由浅入深（一）数据分析工作中很多任务是跟文本处理相关，比如从文本中提取客户的信息，从文本中提取时间等等都是比较常见的操作。虽然Python处理字符串的方法很多，而且流行的pandas库也提供了大量的向量化字符串方法，但是一旦涉及要经过较为复杂的数据匹配才能进行的字符操作，这些方法就显得非常的乏力。尤其是由于文本数据来源于爬虫等渠道，数据往往严重不规整，这时候文本处理起来就显得尤为吃力。幸运的是Python提供了re模块，可以实现正则表达式的操作。re模块主要通过六大方法来对字符串进行处理，包括：match()、search()、findall()、split()、sub()。这些方法涉及到字符串的匹配与替换等操作，在接下来的4篇连载文章里，我们不单只会讲解这4种方法，还会把元字符、行定位符、限定符、字符类、排除字符、选择字符、转义字符、分组等正则表达式最常用知识点贯穿起来。接下来的系列文章将会为大家初步搭建较为完整的Python正则表达式知识体系，如果你已经学习完Python编程基础和数据清洗的课程知识，该系列文章将会让你对使用Python正则表达式达到一学就会，一用就懂的技能熟悉程度，实现真正的融会贯通的目的。 re.match方法我们首先看re模块中较为简单的match()方法。 match 的作用是利用 Pattern

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

Python正则表达式由浅入深（一）.docxVIP