Python网络爬虫技术项目化教程 课件 项目三 网页数据解析与爬取——爬取电影网站中的数据.pptx

Python网络爬虫技术项目化教程 课件 项目三 网页数据解析与爬取——爬取电影网站中的数据.pptx

项目3项目网页数据解析与抓取——抓取电影网站的数据

任务3.1正则表达式及其应用

3.1.1正则表达式介绍正则表达式(RegularExpression,简称regex或regexp)又称规则表达式,是对字符串操作的一种逻辑公式。通俗来讲,正则表达式就像一种高级搜索语言,它不只是简单查找某个词,更像是给计算机下了一个精确的操作指令,让计算机自动帮你找到符合规则的信息。举例如下。查找以字母开头、后面跟着6个数字的内容。查找手机号码格式的内容,查找网页中的所有邮箱地址。

3.1.1正则表达式介绍表3-1所示为常见的正则表达式规则及功能。正则表达式功

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档