- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
正则表达式快速入门
一. 正则表达式测试工具 1
二. 基本用法 2
1. 基本的名词解释 2
2. 本节涉及到的语法表 2
3. 用法举例说明 3
三. 中级用法 5
1. 分组 5
2. 反义 6
3. 后向引用 6
4. 零宽断言 7
5. 负向零宽断言 8
6. 注释: 9
7. 贪婪与懒惰 9
正则表达式的作用
正则表达式的英文是regular expression,意思是符合某种规则的表达式,可以将其理解为一种对文字进行模糊匹配的语言。正则表达式用一些特殊的符号(称为元字符)来代表具有某种特征(例如,某一字符必须是数字字符)的一组字符以及指定匹配的的次数,含有元字符的文本不再表示某一具体的文本内容,而是形成了一种文本模式,可以匹配符合该模式的所有文本串。例如,可以测试输入的字符串,以查看字符串内是否出现电话号码模式或身份证号码模式。即数据验证替换文本可以使用正则表达式来识别文档中的特定文本,完全删除该文本或者用其他文本替换它。事实上,正则表达式在很多语言中都会用到,其内容几乎是独立于具体语言。
正则表达式对字符串的操作主要包括:1.字符串匹配 2.指定字符串替换 3.指定字符串查找 4.字符串分割
正则表达式测试工具
第一步:先确保你的电脑已经安装了“.Net Framework 2.0”,如果你的电脑没有安装,可以到这个网址下载并安装。网址:
/downloads/details.aspx?displaylang=zh-cnFamilyID=0856eacb-4362-4b0d-8edd-aab15c5e04f5
第二步:安装Regex Tester测试工具,网址:
/deerchao/downloads/RegexTester.zip
第三步:这是个绿色软件,下载完后打开压缩包,直接运行RegexTester.exe。
用法:
在Regex空白处输入正则表达式;
在Source空白处输入需要查找的内容
当输入完正则表达式和需要查找的内容后,按F5键,就会在Mateches空白处显示你匹配你所写的正则表达式的内容;
例子:
正则表达式“\bc\w*\b”,这个表达式意思是匹配以字母c开头的单词——先是某个单词开始处(\b),然后是字母c,然后是任意数量的字母或数字(\w*),最后是单词结束处(\b)。
欲查找的内容:cbc,bda,bdamlkfdasfsd,cfdsafsdl,fdakldsaf
按F5键,在Mateches空白处显示结果cbc和cfdsafsdl;
如图1所示
图1
基本用法
基本的名词解释
字符:是指计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等等。
字符串:是指0个或更多个字符的序列。
文本:也就是文字,字符串。
匹配:某个字符串匹配某个正则表达式,通常是指这个字符串里有一部分(或几部分分别)能满足表达式给出的条件。
本节涉及到的语法表
代码 说明 . 匹配除换行符以外包括空格和Tab键的任意字符 * 重复前一个字符或一组表达式零次或更多次 ? 重复前一个字符或一组表达式零次或一次 + 重复前一个字符或一组表达式一次或更多次; - 匹配除了换行符以外的任意字符 \ 转义符,将特殊字符转化为普通字符,取消后面跟着的字符的特殊意义;比如如果你想查找“.”,或者“*”,就需要用“\”。因此,你应该使用“\.”和“\*”。当然,要查找\本身,你也得用“\\.” | 或的表达式,表示分支条件,匹配代码左侧的表达式或匹配代码右侧的表达式两者之一;注意:当左侧的表达式匹配条件相符的话,不再检测右侧的表达式 ^ 匹配字符串的开始的一个位置,同时也表示否的表达式,表示不想被匹配的字符,一般和[]一起使用。也匹配输入字符串的开始 $ 匹配字符串的结束的一个位置 () 匹配一组表达式,该表达式可以由其它特殊字符组成 [] 匹配包含在其中的单个字符 \w 匹配任意一个字母或数字或下划线或汉字等 \W 匹配任意不是字母,数字,下划线,汉字的字符 \s 匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等 \S 匹配任意不是空白符的字符,等价于[^\f\n\r\t\v] \d 匹配任意一位数字,等价于[0~9] \D 匹配任意非数字的字符,等价于[^0~9] \b 匹配一个单词的开始或结束,也就是指单词和空格间的位置 \B 匹配不是单词开头或结束的位置 \f 匹配一个换页符 \n 匹配一个换行符 \r 匹配一个回车符 \t 匹配一个制表符 \v 匹配一个垂直制表符 {n} 重复n次,只对邻近的字符或一组表达式起作用 {n,m} 重复n到m次,只对邻近的字符或一组表达式起作用 (exp) 匹配exp,并捕获文本
文档评论(0)