正则表达式 regex.docVIP

下载本文档

7
0
约8.4千字
约 8页
2018-05-10 发布于河南
举报
版权申诉

正则表达式 regex.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

正则表达式 regex

正则表达式相信大家都有在电脑上查找某个文件的经历，例如需要把C盘中的所有Word文档给找出来，很简单，只需要按“Ctrl+F”快捷键，调出系统的搜索窗口，然后在文件名窗口输入“*.doc”，单击“搜索”按钮后Windows就会找到所有的Word文档。如果改变搜索目标，改为“w*.doc”，那么Windows就会找出所有以字母w开头的Word文档。为什么Windows知道我们要找的是Word文档？为什么它会把所有的Word文档都找出来？秘密就是“*.doc”。这里的*是通配符，表示文件名不限，可以匹配任何的文件名而.doc是扩展名。可见，就是这样一个描述了查询目标特征的字符串，让系统了解了我们的查询目标。正则表达式也类似一个字符串，它描述了目标字符串的特征。正则表达式引擎正是使用这种特征，实现了在一在堆的字符串中查找或者替换我们符合要求的字符串。先来看一个简单的正则表达式：“hi”,使用这个正则表达式可以在“aabbhibbaahiaa”中将两个“hi”字符串给找出来，.NET还提供了一些非常复杂的类来识别字符串，或从长字符串中提取满足某些复杂条件的子字符串。例如，找出字符串中重复出现的某个字符或一组字符，或者找出以s开头、且至少包含一个n的所有单词，或者找出遵循雇员ID或社会安全号码约定的字符串。虽然可以使用String类，编写方法来执行这类处理，但这类方法编写起来比较繁琐，而使用System.Text.RegularExpressions命名空间中的类就比较简单，System.Text. RegularExpressions专门用于执行这类处理。\cx 匹配由x指明的控制字符。例如，‘\cM’匹配一个Control-M或回车符。c的值必须为A-Z或a-z之一。否则，将c将视为一个原义的“c”字符。 \xnn 匹配n,其中n为十六进制转义值。十六进制转义值必须确定的两个数字长。例如，‘x41’匹配“A”。‘\x041’则等价于‘\x04’“1”。正则表达式可以用ASCII编码。 \unnnn 匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如，\u00A9匹配版权符号（?）定位点定位点主要作用是指示字符串中必须发生匹配的位置，如果正则表达式中使用了定位点，那么引擎就不会在字符串的其他位置搜索，而是只在定位点指示的位置搜索，例如：$指示必须从字符串的末尾或者行尾开始搜索，而^则指示从开头开始搜索，具体的定点列表如表所示。元素说明示例匹配的示例 ^ 匹配必须从字符串或一行的开头开始。 ^\d 匹配“206”的2 $ 匹配必须出现在字符串的末尾或出现在字符串末尾的\n之前 \d$ 匹配“206”的6 \A 匹配必须出现在字符串的开头 \A\d 匹配“206”的2 \Z 匹配必须出现在字符串的末尾或出现在字符串末尾的\n之前 \d\Z 匹配“206”的6 \z 匹配必须出现在字符串的末尾 \d\z 匹配“206”的6 \G 匹配必须出现在上一个匹配结束的地方 \G\d 匹配“2a06”中的2 \b 匹配一个单词边界，也就是指单词和空格间的位置 \d\b 可以匹配“dogs102”中的2，但不能匹配其中的1和0 \B 匹配不能出现在\b边界上 \d\B 可以匹配“dogs102”中的1和0，但不能匹配2 字符类字符类与一组字符中的任何一个字符匹配。字符类说明 . 小数点可以匹配除了换行符“”之外的任何单个字符。如可以匹配“favorite”中的全部字符. x|y 匹配 x 或 y。例如，z|food 能匹配 z 或 food。(z|f)ood 则匹配 zood 或 food。 [xyz] 字符集合。匹配所包含的任意一个字符。例如， [abc] 可以匹配 plain 中的 a。 [^xyz] 负值字符集合。匹配未包含的任意字符。例如， [^abc] 可以匹配 plain 中的。 [a-z] 字符范围。匹配指定范围内的任意字符。例如，[a-z] 可以匹配 a 到 z 范围内的任意小写字母字符。 [^a-z] 负值字符范围。匹配任何不在指定范围内的任意字符。例如，[^a-z] 可以匹配任何不在 a 到 z 范围内的任意字符。 \d 匹配一个数字字符。等价于 [0-9]。 \D 匹配一个非数字字符。等价于 [^0-9]。 \s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。’m ok!”中的空格，字符索引3开始，到索引4截止。 \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \w 匹配包括下划线的任何单词字符。等价于[A-Za-z0-9_]。 \W 匹配任何非单词字符。等价于 [^A-Za