网站大量收购闲置独家精品文档,联系QQ:2885784924

《数据采集技术》课件——正则表达式.pptxVIP

《数据采集技术》课件——正则表达式.pptx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

正则表达式

Contents知识目标掌握正则表达式常用语法技能目标提高数据分析和处理能力素养目标培养良好的信息素养和道德意识

正则表达式RegularExpression,简称RE常用于:检索、替换符合某个模式的文本正则表达式是一段字符串,可以表示一段有规律的信息。

正则表达式RegularExpression,简称REPython自带一个正则表达式模块,通过这个模块可以:查找、提取、替换一段有规律的信息

Python正则表达式模块Python标准库中的re模块提供正则表达式的全部功能,可以直接引入。importre

正则表达式的模式正则表达式的模式内容字面值字符例如字母、数字、空格等,可以直接匹配它们自身。特殊字符例如点号.、星号*、加号+、问号?等,它们具有特殊的含义和功能。字符类用方括号[]包围的字符集合,用于匹配方括号内的任意一个字符。元字符例如\d、\w、\s等,用于匹配特定类型的字符,如数字、字母、空白字符等。量词例如{n}、{n,}、{n,m}等,用于指定匹配的次数或范围。边界符号例如^、$、\b、\B等,用于匹配字符串的开头、结尾或单词边界位置。

正则表达式的模式方法说明compile将正则表达式的字符串转化为Pattern匹配对象。match将输入的字符串从头开始对输入的正则表达式进行匹配,一直向后直至遇到无法匹配的字符或到达字符串末尾,将立即返回None,否则获取匹配结果。search将输入的字符串整个扫描,对输入的正则表达式进行匹配,获取匹配结果,否则输出None。split按照能够匹配的字符串作为分隔符,将字符串分割后返回一个列表。findall搜索整个字符串,返回一个列表包含全部能匹配的子串。finditer与findall方法作用类似,以迭代器的形式返回结果。sub使用指定内容替换字符串中匹配的每一个子串内容。re模块中常用的方法如下表所示

re模块中常用的方法将正则表达式的字符串转化为Pattern匹配对象,compile方法的语法格式:pile(pattern[,flags])pattern一个字符串形式的正则表达式flag一个可选参数,表示匹配模式比如忽略大小写,多行模式等compile方法

re模块中常用的方法flag参数的可选值如表所示:可选值说明re.I忽略大小写re.M多行模式,改变“^”和“$”的行为re.S“.”任意匹配模式,改变“.”的行为re.L使预定字符类\w\W\b\B\s\S取决与当前区域设定re.U使预定字符类\w\W\b\B\s\S\d\D取决于unicode定义的字符属性re.X详细模式,该模式下正则表达式可为多行,忽略空白字符并可加入注释compile方法

re模块中常用的方法搜索整个string,返回一个列表包含全部能匹配的子串,其语法格式如下:re.findall(pattern,string[,flags])参数说明pattern接收Pattern实例。表示转换后的正则表达式。无默认值。string接收string。表示输入的需要匹配的字符串。无默认值。flag接收string。表示匹配模式,取值为运算符“|”时表示同时生效,如re.I|re.M。默认为None。findall方法

re模块中常用的方法常用的参数如表所示:参数说明pattern接收Pattern实例。表示转换后的正则表达式。无默认值。string接收string。表示输入的需要匹配的字符串。无默认值。flag接收string。表示匹配模式,取值为运算符“|”时表示同时生效,如re.I|re.M。默认为None。findall方法

正则表达式的基本符号可以代替除了换行符以外的任何一个字符,包括但不限于英文字母、数字、汉字、英文标点符号和中文标点符号。可以表示它前面的一个子表达式(普通字符、另一个或几个正则表达式符号)0次到无限次。表示它前面的子表达式0次或者1次。注意是英文问号。1.点号“.”2.星号“*”3.问号“?”

正则表达式的基本符号4.反斜杠“\”在正则表达式里面不能单独使用,在整个Python里都不能单独使用。需要和其他的字符配合使用:特殊符号普通符号变成“\n”一个普通的字母“\n”换行符例如:

正则表达式的基本符号4.反斜杠“\”在正则表达式里面不能单独使用,甚至在整个Python里都不能单独使用。反斜杠需要和其他的字符配合使用来把特殊符号变成普通符号,把普通符号变成特殊符号。特殊符号普通符号功能:变成“\n”一个普通的字母“\n”换行符例如:

正则表达式的基本符号Python开发中经常遇到的转义字符转义字符在字符串中插入特殊字符或控制结构。一个或多个字符开头后面反斜杠(\)

正则表达式的基本符号Python开发中经常遇到的转义

您可能关注的文档

文档评论(0)

青柠职教 + 关注
实名认证
服务提供商

从业10年,专注职业教育专业建设,实训室建设等。

1亿VIP精品文档

相关文档