- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正则表达式课堂笔记
正则表达式基础 Regular Expression
正则表达式简介
为什么需要正则表达式?
文本的复杂处理。
正则表达式的优势和用途?
一种强大而灵活的文本处理工具;
提供了一种紧凑的、动态的方式,能够以一种完全通用的方式来解决各种字符串处理(例如:验证、查找、替换等)问题;
大部分语言、数据库都支持正则表达式。
正则表达式定义:
正如他的名字一样是描述了一个规则,通过这个规则可以匹配一类字符串。
正则表达式的用处:
验证给定字符串是否符合指定特征,比如验证是否是合法的邮件地址。
用来查找字符串,从一个长的文本中查找符合指定特征的字符串。
用来替换,比普通的替换更强大
工具软件RegexBuddy的使用
为了提高开发效率,一般都先在工具软件中测试正则表达式,通过测试后,才在程序中使用。
正则表达式规则
普通字符
字母、数字、汉字、下划线、以及没有特殊定义的标点符号,都是“普通字符”。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。
简单的转义字符
\n 代表换行符 \t 制表符 \\ 代表\本身 \^ ,\$,\.,\(, \) , \{, \} , \? , \+ , \* , \| ,\[, \] 匹配这些字符本身
标准字符集合:能够与 ‘多种字符’ 匹配的表达式
(注意区分大小写,大写是相反的意思)
\d 任意一个数字,0~9 中的任意一个 \w 任意一个字母或数字或下划线,也就是 A~Z,a~z,0~9,_ 中任意一个 \s 包括空格、制表符、换行符等空白字符的其中任意一个 . 小数点可以匹配除了换行符(\n)以外的任意一个字符
自定义字符集合:[ ]方括号匹配方式,能够匹配方括号中任意一个字符
[ab5@] 匹配 a 或 b 或 5 或 @ [^abc] 匹配 a,b,c 之外的任意一个字符 [f-k] 匹配 f~k 之间的任意一个字母 [^A-F0-3] 匹配 A~F,0~3 之外的任意一个字符 注意事项:
1. 正则表达式中的特殊符号,如果被包含于中括号中,则失去特殊意义,但 \ [ ] : ^ - 除外。标准字符集合,除小数点(.)外,如果被包含于中括号中,自定义字符集合将包含该集合。比如:[\d.\-+],将可以匹配数字,小数点和 + - 符号。(小数点和 + 号失去特殊意义)
{n} 表达式重复n次 {m,n} 表达式至少重复m次,最多重复n次 {m,} 表达式至少重复m次 ? 匹配表达式0次或者1次,相当于 {0,1} + 表达式至少出现1次,相当于 {1,} * 表达式不出现或出现任意次,相当于 {0,} 匹配次数中的贪婪模式(匹配字符越多越好)
“{m,n}”, “{m,}”, “?”, “*”, “+”,具体匹配的次数随被匹配的字符串而定。这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。
匹配次数中的非贪婪模式(匹配字符越少越好)
在修饰匹配次数的特殊符号后再加上一个 ? 号,则可以使匹配次数不定的表达式尽可能少的匹配,使可匹配可不匹配的表达式,尽可能的 不匹配。
字符边界(本组标记匹配的不是字符而是位置,符合某种条件的位置)
^ 与字符串开始的地方匹配 $ 与字符串结束的地方匹配 \b 匹配一个单词边界
选择符和分组
表达式 作用 | 左右两边表达式之间 或 关系,匹配左边或者右边 ( ) (1). 在被修饰匹配次数的时候,括号中的表达式可以作为整体被修饰
(2). 取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
(3). 每一对括号会分配一个编号,使用 () 的捕获根据左括号的顺序从 1 开始自动编号。捕获元素编号为零的第一个捕获是由整个正则表达式模式匹配的文本
反向引用(\nnn)
每一对()会分配一个编号,使用 () 的捕获根据左括号的顺序从 1 开始自动编号。
通过反向引用,可以对分组已捕获的字符串进行引用。
非捕获组(?:xxx)
与捕获组的区别在于不捕获匹配的文本,仅仅作为分组。其他地方一致。
模式修改符 (?ismg)*****(?-ismg) (用的不多,听听就行!)
在正则表达式中间,对匹配模式进行修改。
大小写模式修改,比如匹配a,A:
[aA]
把整个模式修改为大小写不敏感。
(?i)a(?-i)
预搜索(零宽断言)
判断当前位置的前后字符,是否符合指定的条件,但不匹配前后的字符。是对位置的匹配。
(?=exp) 断言自身出现的位置的后面能匹配表达式exp (?=exp) 断言自身出现的位置的前面能匹配表达式exp (?!exp) 断言此位置的后面不能匹配表达式exp (?!exp) 断言此位置的前
文档评论(0)