正则表达式之任意字符要领.pdfVIP

下载本文档

2
0
约6.08千字
约 5页
2017-06-17 发布于北京
举报
版权申诉

正则表达式之任意字符要领.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

正则表达式之任意字符注：元字符包括\ | ( ) [ ] { } ^ $ * + ? . ) 匹配中⽂字符的正则表达式： [\u4e00-\u9fa5] 评注：匹配中⽂还真是个头疼的事，有了这个表达式就好了匹配双字节字符(包括汉字在内) ：[^\x00-\xff] 评注：可以⽤来计算字符串的长度（⼀个双字节字符长度计2 ，ASCII字符计 1）匹配空⽩⾏的正则表达式：\ \s*\r 评注：可以⽤来删除空⽩⾏匹配HTML标记的正则表达式：(\S*?)[^]* .*?/|.*? / 评注：⽹上流传的版本太糟糕，上⾯这个也仅仅能匹配部分，对于复杂的嵌套标记依旧⽆能为⼒匹配⾸尾空⽩字符的正则表达式：^\s*|\s*$ 评注：可以⽤来删除⾏⾸⾏尾的空⽩字符(包括空格、制表符、换页符等等) ，⾮常有⽤的表达式匹配Email地址的正则表达式：\w+([-+.]\w+)*@\w+([-.]\w+)*\ .\w+([-.]\w+)* 评注：表单验证时很实⽤匹配⽹址URL 的正则表达式：[a-zA-z]+:// [^\s]* 评注：⽹上流传的版本功能很有限，上⾯这个基本可以满⾜需求匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线) ：^[a-zA- Z][a-zA-Z0-9_]$ 评注：表单验证时很实⽤匹配国内电话号码：\d-\d|\d-\d 评注：匹配形式如 05 11-4405222 或 02 1 匹配腾讯QQ号：[1-9][0-9] 评注：腾讯QQ号从10000开始匹配中国邮政编码：[1-9]\d(?!\d) 评注：中国邮政编码为6位数字匹配⾝份证：\d|\d 评注：中国的⾝份证为15位或18位匹配ip地址：\d+\ .\d+\ .\d+\ .\d+ 评注：提取ip地址时有⽤匹配特定数字： ^[1-9]\d*$　　 // 匹配正整数 ^-[1-9]\d*$ 　 // 匹配负整数 ^-?[1-9]\d*$　　 // 匹配整数 ^[1-9]\d*|0$　 // 匹配⾮负整数（正整数 + 0 ） ^-[1-9]\d*|0$　　 // 匹配⾮正整数（负整数 + 0 ） ^[1-9]\d*\ .\d*|0\ .\d*[1-9]\d*$　　 // 匹配正浮点数 ^-([1-9]\d*\ .\d*|0\ .\d*[1-9]\d*)$　 // 匹配负浮点数 ^-?([1-9]\d*\ .\d*|0\ .\d*[1-9]\d*|0?\ .0+|0)$　 // 匹配浮点数 ^[1-9]\d*\ .\d*|0\ .\d*[1-9]\d*|0?\ .0+|0$　　 // 匹配⾮负浮点数（正浮点数 + 0 ） ^(-([1-9]\d*\ .\d*|0\ .\d*[1-9]\d*))|0?\ .0+|0$　　// 匹配⾮正浮点数（负浮点数 + 0 ）评注：处理⼤量数据时有⽤，具体应⽤时注意修正匹配特定字符串： ^[A-Za-z]+$　　// 匹配由26个英⽂字母组成的字符串 ^[A-Z]+$　　// 匹配由26个英⽂字母的⼤写组成的字符串 ^[a-z]+$　　// 匹配由26个英⽂字母的⼩写组成的字符串 ^[A-Za-z0-9]+$　　// 匹配由数字和26个英⽂字母组成的字符串 ^\w+$　　// 匹配由数字、26个英⽂字母或者下划线组成的字符串评注：最基本也是最常⽤的⼀些表达式今天在Java 中想使⽤正则表达式来获取⼀段⽂本中的任意字符。于是很随意得就写出如下匹配规则： (.*) 结果运⾏之后才发现，⽆法获得换⾏之后的⽂本。于是查了⼀下⼿册，才发现正则表达式中，“ .”(点符号)匹配的是除了换⾏符“\ ” 以外的所有字符。同时，⼿册上还有⼀句话：要匹配包括 ‘\