- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(完整word版)正那么表达式和字符串处理(全)
(完整word版)正那么表达式和字符串处理(全)
PAGE
PAGE9
(完整word版)正那么表达式和字符串处理(全)
PAGE
正那么表达式和字符串处理 (全)
第一章 正那么表达式概述
正那么表达式(RegularExpression)起源于人类神经系统的研究。正那么表达式的定义有以下几种:
用某种模式去匹配一类字符串的公式,它主要是用来描述字符串匹配的工具。
描述了一种字符串匹配的模式。可以用来检查字符串是否含有某种子串、将匹配的子串做替换或者从中取出符合某个条件的子串等。
由普通字符(a-z)以及特殊字符〔元字符〕组成的文字模式,正那么表达式作为一个模版,将某个字符模式与所搜索的字符串进行匹配。
用于描述某些规那么的的工具。这些规那么经常用于处理字符串中的查找或替换字符串。
也就是说正那么表达式就是记录文本规那么的代码。
用一个字符串来描述一个特征,然后去验证另一个字符串是否符合这个特征。
以上这些定义其实也就是正那么表达式的作用。
第二章正那么表达式根底理论
这些理论将为编写正那么表达式提供法那么和标准,正那么表达式主要包括以下根底理论:
元字符
字符串
字符转义
反义
限定符
替换
分组
反向引用
零宽度断言
匹配选项
注释
优先级顺序
递归匹配
2.1元字符
在正那么表达式中,元字符〔 Metacharacter〕是一类非常特殊的字符,它能够匹配一个位置
或字符集合中的一个字符,如:、 \w等。根据功能,元字符可以分为两种类型:匹配位置
的元字符和匹配字符的元字符。
2.1.1匹配位置的元字符
包括:^、$、和\b。其中^〔脱字符号〕和 $〔美元符号〕都匹配一个位置,分别匹配行的开
始和结尾。比方,^string匹配以string开头的行,string$匹配以string结尾的行。^string$匹配以string开始和结尾的行。单个$匹配一个空行。单个^匹配任意行。\b匹配单词的开始和结尾,如:\bstr匹配以str开始的单词,但\b不匹配空格、标点符号或换行符号,所以,
\bstr可以匹配 string、stringfomat等单词。\bstr正那么表达式匹配的字符串必须以str开头,并且str以前是单词的分界处,但此正那么表达式不能限定str之后的字符串形式。以下正那么表达式匹配以 ing结尾的字符串,如 string、Thisisastring等
Ing\b正那么表达式 ing\b匹配的字符串必须以 ing结尾,并且 ing后是分界符,以下正那么表达式匹配一个完整的单词:\bstring\b。
匹配字符的元字符匹配字符的元字符有 7个:.(点号)、\w、\W、、、\S、\d和\D。其中点号匹配除换行之外的任意字符;\w匹配单词字符〔包括字母、汉字、下划线和数字〕;\W匹配任意非单词字符、\s匹配任意的空白字符,如空格、制表符、换行等;\S匹配任意的非空白字符;\d匹配任意数字字符;\D匹配任意的非数字字符。如:^.$匹配一个非空行,在该行中可以包含除了换行符以外的任意字符。
^\w$匹配一个非空行,并且该行中只能包含字母、数字、下划线和汉字中的任意字符。
\ba\w\w\w\w\w\w\\b 匹配以字母 a开头长度等于7的任意单词
\ba\w\w\w\d\d\d\D\b 匹配以字母 a开头后面有 3个字符三个数字和 1个非数字字符长度等于8的单词
字符类字符类是一个字符集合,如果该字符集合中的任何一个字符被匹配,那么它会找到该匹配项。字符类可以在[]〔方括号〕中定义。如:[012345]可以匹配数字0到5中的任意一个。
H[123456]
可以匹配
HTML
标签中的
H1
到
H6。
[Jj]ack
可以匹配字符串
Jack
或jack。
但是,由于表达式[0123456789]书写非常不方便,连字符 (-)便应用而生,[0-9]等价于[0123456789]。[a-z]匹配任何小写字母,[A-Z]匹配任意大写字母。如果要在字符类中包含连字符,那么必须包含在第一位,如:[-a]表示表达式匹配 -或者a。在字符类中如果 ^是字符
类的第一个字符表示否认该字符串,也就是匹配该字符串外的任意字符,如:
[^abc]匹配除
了abc以外的任意字符,[^-]匹配除了连字符以外的任意字符,a[^b]匹配a之后不是b的字符串。表2-1常用的字符类
字符或表达式
\w\W\s\S\d\D[abc][^abc][0-9a-z_A-Z_]\p{name}\P{name}
.[^0-9a-zA-Z_]
说明匹配单词字符 (包括字母、数字、下划线和汉字)匹配任意的非单词字符(包括字母、数字、下划线和汉字)匹配任意的空白字符,如空格、制
您可能关注的文档
最近下载
- 小学数学教学中学生逻辑推理能力的培养策略教学研究课题报告.docx
- [浙江]永康市委统战部编制外工作人员招聘笔试历年参考题库附带答案详解.doc VIP
- 教你三步查看老婆微信聊天记录.docx VIP
- 2022年公务员考试内蒙古行政职业能力测验真题.doc VIP
- 兴澄特钢海洋工程用钢研究与开发现状..ppt VIP
- 运动解剖学课件.pptx VIP
- 2025年气瓶检验员考试题及答案.docx VIP
- 大学藏文四级考试题库及答案.doc VIP
- (2025秋新版)人教版三年级数学上册全册教案.pdf
- 新解读《GB_T 20970-2015石油天然气工业 井下工具 封隔器和桥塞》最新解读.docx VIP
文档评论(0)