正则表达式 regex.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正则表达式 regex

正则表达式 相信大家都有在电脑上查找某个文件的经历,例如需要把C盘中的所有Word文档给找出来,很简单,只需要按“Ctrl+F”快捷键,调出系统的搜索窗口,然后在文件名窗口输入“*.doc”,单击“搜索”按钮后Windows就会找到所有的Word文档。如果改变搜索目标,改为“w*.doc”,那么Windows就会找出所有以字母w开头的Word文档。 为什么Windows知道我们要找的是Word文档?为什么它会把所有的Word文档都找出来?秘密就是“*.doc”。这里的*是通配符,表示文件名不限,可以匹配任何的文件名而.doc是扩展名。可见,就是这样一个描述了查询目标特征的字符串,让系统了解了我们的查询目标。 正则表达式也类似一个字符串,它描述了目标字符串的特征。正则表达式引擎正是使用这种特征,实现了在一在堆的字符串中查找或者替换我们符合要求的字符串。先来看一个简单的正则表达式:“hi”,使用这个正则表达式可以在“aabbhibbaahiaa”中将两个“hi”字符串给找出来,.NET还提供了一些非常复杂的类来识别字符串,或从长字符串中提取满足某些复杂条件的子字符串。例如,找出字符串中重复出现的某个字符或一组字符,或者找出以s开头、且至少包含一个n的所有单词,或者找出遵循雇员ID或社会安全号码约定的字符串。虽然可以使用String类,编写方法来执行这类处理,但这类方法编写起来比较繁琐,而使用System.Text.RegularExpressions命名空间中的类就比较简单,System.Text. RegularExpressions专门用于执行这类处理。\cx 匹配由x指明的控制字符。例如,‘\cM’匹配一个Control-M或回车符。c的值必须为A-Z或a-z之一。否则,将c将视为一个原义的“c”字符。 \xnn 匹配n,其中n为十六进制转义值。十六进制转义值必须确定的两个数字长。例如,‘x41’匹配“A”。‘\x041’则等价于‘\x04’“1”。正则表达式可以用ASCII编码。 \unnnn 匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(?) 定位点 定位点主要作用是指示字符串中必须发生匹配的位置,如果正则表达式中使用了定位点,那么引擎就不会在字符串的其他位置搜索,而是只在定位点指示的位置搜索,例如:$指示必须从字符串的末尾或者行尾开始搜索,而^则指示从开头开始搜索,具体的定点列表如表所示。 元素 说明 示例 匹配的示例 ^ 匹配必须从字符串或一行的开头开始。 ^\d 匹配“206”的2 $ 匹配必须出现在字符串的末尾或出现在字符串末尾的\n之前 \d$ 匹配“206”的6 \A 匹配必须出现在字符串的开头 \A\d 匹配“206”的2 \Z 匹配必须出现在字符串的末尾或出现在字符串末尾的\n之前 \d\Z 匹配“206”的6 \z 匹配必须出现在字符串的末尾 \d\z 匹配“206”的6 \G 匹配必须出现在上一个匹配结束的地方 \G\d 匹配“2a06”中的2 \b 匹配一个单词边界,也就是指单词和空格间的位置 \d\b 可以匹配“dogs102”中的2,但不能匹配其中的1和0 \B 匹配不能出现在\b边界上 \d\B 可以匹配“dogs102”中的1和0,但不能匹配2 字符类 字符类与一组字符中的任何一个字符匹配。 字符类 说明 . 小数点可以匹配除了换行符“”之外的任何单个字符。如可以匹配“favorite”中的全部字符. x|y 匹配 x 或 y。例如,z|food 能匹配 z 或 food。(z|f)ood 则匹配 zood 或 food。 [xyz] 字符集合。匹配所包含的任意一个字符。例如, [abc] 可以匹配 plain 中的 a。 [^xyz] 负值字符集合。匹配未包含的任意字符。例如, [^abc] 可以匹配 plain 中的。 [a-z] 字符范围。匹配指定范围内的任意字符。例如,[a-z] 可以匹配 a 到 z 范围内的任意小写字母字符。 [^a-z] 负值字符范围。匹配任何不在指定范围内的任意字符。例如,[^a-z] 可以匹配任何不在 a 到 z 范围内的任意字符。 \d 匹配一个数字字符。等价于 [0-9]。 \D 匹配一个非数字字符。等价于 [^0-9]。 \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。’m ok!”中的空格,字符索引3开始,到索引4截止。 \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \w 匹配包括下划线的任何单词字符。等价于[A-Za-z0-9_]。 \W 匹配任何非单词字符。等价于 [^A-Za

文档评论(0)

jgx3536 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6111134150000003

1亿VIP精品文档

相关文档