正则表达式快速入门详解.docVIP

下载本文档

1
0
约1.08万字
约 32页
2017-06-17 发布于北京
举报
版权申诉

正则表达式快速入门详解.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

正则表达式快速入门一．正则表达式测试工具 1 二．基本用法 2 1. 基本的名词解释 2 2. 本节涉及到的语法表 2 3. 用法举例说明 3 三．中级用法 5 1. 分组 5 2. 反义 6 3. 后向引用 6 4. 零宽断言 7 5. 负向零宽断言 8 6. 注释： 9 7. 贪婪与懒惰 9 正则表达式的作用正则表达式的英文是regular expression，意思是符合某种规则的表达式，可以将其理解为一种对文字进行模糊匹配的语言。正则表达式用一些特殊的符号（称为元字符）来代表具有某种特征（例如，某一字符必须是数字字符）的一组字符以及指定匹配的的次数，含有元字符的文本不再表示某一具体的文本内容，而是形成了一种文本模式，可以匹配符合该模式的所有文本串。例如，可以测试输入的字符串，以查看字符串内是否出现电话号码模式或身份证号码模式。即数据验证替换文本可以使用正则表达式来识别文档中的特定文本，完全删除该文本或者用其他文本替换它。事实上，正则表达式在很多语言中都会用到，其内容几乎是独立于具体语言。正则表达式对字符串的操作主要包括：1.字符串匹配 2.指定字符串替换 3.指定字符串查找 4.字符串分割正则表达式测试工具第一步：先确保你的电脑已经安装了“.Net Framework 2.0”，如果你的电脑没有安装，可以到这个网址下载并安装。网址： /downloads/details.aspx?displaylang=zh-cnFamilyID=0856eacb-4362-4b0d-8edd-aab15c5e04f5 第二步：安装Regex Tester测试工具，网址： /deerchao/downloads/RegexTester.zip 第三步：这是个绿色软件，下载完后打开压缩包,直接运行RegexTester.exe。用法：在Regex空白处输入正则表达式；在Source空白处输入需要查找的内容当输入完正则表达式和需要查找的内容后，按F5键，就会在Mateches空白处显示你匹配你所写的正则表达式的内容；例子：正则表达式“\bc\w*\b”，这个表达式意思是匹配以字母c开头的单词——先是某个单词开始处(\b)，然后是字母c,然后是任意数量的字母或数字(\w*)，最后是单词结束处(\b)。欲查找的内容：cbc,bda,bdamlkfdasfsd,cfdsafsdl,fdakldsaf 按F5键，在Mateches空白处显示结果cbc和cfdsafsdl；如图1所示图1 基本用法基本的名词解释字符：是指计算机软件处理文字时最基本的单位，可能是字母，数字，标点符号，空格，换行符，汉字等等。字符串：是指0个或更多个字符的序列。文本：也就是文字，字符串。匹配：某个字符串匹配某个正则表达式，通常是指这个字符串里有一部分（或几部分分别）能满足表达式给出的条件。本节涉及到的语法表代码说明 . 匹配除换行符以外包括空格和Tab键的任意字符 * 重复前一个字符或一组表达式零次或更多次 ? 重复前一个字符或一组表达式零次或一次 + 重复前一个字符或一组表达式一次或更多次； - 匹配除了换行符以外的任意字符 \ 转义符，将特殊字符转化为普通字符，取消后面跟着的字符的特殊意义；比如如果你想查找“.”,或者“*”,就需要用“\”。因此，你应该使用“\.”和“\*”。当然，要查找\本身，你也得用“\\.” | 或的表达式，表示分支条件，匹配代码左侧的表达式或匹配代码右侧的表达式两者之一；注意：当左侧的表达式匹配条件相符的话，不再检测右侧的表达式 ^ 匹配字符串的开始的一个位置，同时也表示否的表达式，表示不想被匹配的字符，一般和[]一起使用。也匹配输入字符串的开始 $ 匹配字符串的结束的一个位置 () 匹配一组表达式，该表达式可以由其它特殊字符组成 [] 匹配包含在其中的单个字符 \w 匹配任意一个字母或数字或下划线或汉字等 \W 匹配任意不是字母，数字，下划线，汉字的字符 \s 匹配任意的空白符，包括空格，制表符(Tab)，换行符，中文全角空格等 \S 匹配任意不是空白符的字符，等价于[^\f\n\r\t\v] \d 匹配任意一位数字，等价于[0~9] \D 匹配任意非数字的字符，等价于[^0~9] \b 匹配一个单词的开始或结束，也就是指单词和空格间的位置 \B 匹配不是单词开头或结束的位置 \f 匹配一个换页符 \n 匹配一个换行符 \r 匹配一个回车符 \t 匹配一个制表符 \v 匹配一个垂直制表符 {n} 重复n次，只对邻近的字符或一组表达式起作用 {n,m} 重复n到m次，只对邻近的字符或一组表达式起作用 (exp) 匹配exp,并捕获文本