正则表达式介绍和例子讲义.docxVIP

下载本文档

8
0
约2.89千字
约 9页
2017-03-26 发布于湖北
举报
版权申诉

正则表达式介绍和例子讲义.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

正则表达式 ? 含义：编写字符串处理的程序或网页时，会有查找符合某复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。它是记录文本规则的代码。元字符用来代替字符的符号表1.常用的元字符代码说明 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字注：\s匹配任意的空白符，包括空格，制表符(Tab)，换行符，中文全角空格等正则表达式中的空格会当成空格匹配。（输入几个空格就匹配几个）非打印字符非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列：字符描述 \cx 匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 c 字符。 \f 匹配一个换页符。等价于 \x0c 和 \cL。 \n 匹配一个换行符。等价于 \x0a 和 \cJ。 \r 匹配一个回车符。等价于 \x0d 和 \cM。 \s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \t 匹配一个制表符。等价于 \x09 和 \cI。 \v 匹配一个垂直制表符。等价于 \x0b 和 \cK。限定符重复：表现重复时用的是大括号{}和* + ？，表示范围时用的是中括号[]，中括号里面是只选其中一个的组合。表达分组时用圆括号（），一个圆括号表示一个意思。表2.常用的限定符代码/语法说明 * 重复零次或更多次 + 重复一次或更多次 ? 重复零次或一次 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 ? 字符类[]，用来表示取字符的范围区间，用中括号括起来 [0-9]代表\d [a-z0-9A-Z]表示\w ? 分支条件，用|表示或者的关系。 ? 贪婪与懒惰、最先开始匹配拥有最高优先权 *、+和?限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。 .*表示尽可能匹配多的字符 .*?表示尽可能少的字符例如：字符串aabab，用贪婪匹配a.*b得到aabab，用懒惰匹配a.*?b得到aab和ab 定位符定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式，这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。定位符用来描述字符串或单词的边界，^和$分别指字符串的开始与结束，\b描述单词的前或后边界，\B表示非单词边界。正则表达式的限定符有：字符描述 ^ 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。 $ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。 \b 匹配一个字边界，即字与空格间的位置。 \B 非字边界匹配。子表达式分组获取（） ? 分组，用（）把子表达式括起来，给一个组号，后面可以再用 ? 后向引用，用（）定义的分组，可以给它定一个组名，在后面加以利用。用(?Word\w+)或者(?’Word’\w+)定义\w+组名为Word，利用方式为\kWord 表4.常用分组语法分类代码/语法说明捕获 (exp) 匹配exp,并捕获文本到自动命名的组里 (?nameexp) 匹配exp,并捕获文本到名称为name的组里，也可以写成(?nameexp) 非捕获 (?:exp) 匹配exp,不捕获匹配的文本，也不给此分组分配组号零宽断言 (?=exp) 匹配exp前面的位置 (?=exp) 匹配exp后面的位置 (?!exp) 匹配后面跟的不是exp的位置 (?!exp) 匹配前面不是exp的位置注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读捕获从下面的例子中可以看到，根据正则表达式，只捕获了括号内的东西到组中，第一个括号前面^\D*匹配到的东西被忽略了。零宽度断言 (?=exp) 用法：\b\w+(?=ing)\b，匹配以ing结尾的单词的前面部分，如查找I’m singing and dancing，会匹配sing和danc (?=exp) 用法：(?=rea)\w+\b，匹配以rea开头的单词的后面部分，如查找reading a book，会匹配ding 注释：(?#comment) 例如：2[0-4]\d(?#200-249)|25[0-5](?#250-255)|[01]?\d\d?(?#0-199