- 2
- 0
- 约4.3千字
- 约 7页
- 2020-04-15 发布于贵州
- 举报
PAGE 2
Python正则表达式由浅入深(一)
数据分析工作中很多任务是跟文本处理相关,比如从文本中提取客户的信息,从文本中提取时间等等都是比较常见的操作。 虽然Python处理字符串的方法很多,而且流行的pandas库也提供了大量的向量化字符串方法,但是一旦涉及要经过较为复杂的数据匹配才能进行的字符操作,这些方法就显得非常的乏力。
尤其是由于文本数据来源于爬虫等渠道,数据往往严重不规整,这时候文本处理起来就显得尤为吃力。
幸运的是Python提供了re模块,可以实现正则表达式的操作。re模块主要通过六大方法来对字符串进行处理,包括:match()、search()、findall()、split()、sub()。
这些方法涉及到字符串的匹配与替换等操作,在接下来的4篇连载文章里,我们不单只会讲解这4种方法,还会把元字符、行定位符、限定符、字符类、排除字符、选择字符、转义字符、分组等正则表达式最常用知识点贯穿起来。
接下来的系列文章将会为大家初步搭建较为完整的Python正则表达式知识体系,如果你已经学习完Python编程基础和数据清洗的课程知识,该系列文章将会让你对使用Python正则表达式达到一学就会,一用就懂的技能熟悉程度,实现真正的融会贯通的目的。
re.match方法
我们首先看re模块中较为简单的match()方法。
match 的作用是利用 Pattern
您可能关注的文档
最近下载
- 格兰富LS中开泵安装维护手册(1).pdf VIP
- 2006年重庆市高考数学试卷(文科)【附答案、word版本,可再编辑;B4纸型两栏】.docx VIP
- 工业设计机械产品课设计指导书.doc VIP
- 2025重庆园林工程师中高级园林工程技术考试试题(凭记忆复原) .pdf VIP
- 塑钢门窗维修施工方案.docx VIP
- 2026年广播电视编辑记者新闻采编测试卷及答案.docx VIP
- 一 成都市内主要动与植物及分布情况.doc VIP
- 第11课班级故事(课件)心理健康华中师大版一年级全一册.pptx
- 四川文理学院高等教育本科学士学位英语考试历年真题.pdf VIP
- 2026 年记者采编(新闻写作)试题及答案.docx VIP
原创力文档

文档评论(0)