- 1、本文档共15页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
今天想用正则表达式来获取收到的http报文中的content-length字段的值的时候,无意中发现一篇用tcl语言写的文章,觉得很不错。所以转载。一、?????介绍追根溯源,正则表达式是在1956年的时候,人类最早研究神经网络的产物,但随着时间的流逝,几乎所有编程语言都加入了对它的支持,hoho~其实这个东西也是程序员开发中比较有名的一个难点。但是不要以为它只能用于程序开发,在Unix/Linux系统管理中它也有极为广泛的应用。不要认为正则表达式很可怕,用直白的话来说,正则表达式就是利用26个英文字符与一些特殊符号的配合来进行文字内容比对的方法,绝大部分情况下,26个英文字符都代表它们本身,但在特殊符号的辅助下,这些英文字符也会有其他的含义,正则表达式比较困难的地方,也就在这种字符的2义性上面,这篇文档中对于这种具有字符2义性的地方,都会有专门的标注和说明。如果用过Dos/Windows/Linux中的通配符,就可以理解正则表达式的作用了,通配符用*号匹配任意多的任意字符,用?号匹配任意的一个字符,正则表达式有更加复杂的一套匹配系统,可以用来匹配几乎所有希望匹配的文字内容。二、?????文档约定本文档中的所有实例,都是在以下环境中调试和运行的:操作系统:???????????CentOS4.1??(Linux 2.6.9-11)编程语言:???????????TCL8.4文本编辑器:?????????VIM6.3.46文档格式约定:实例的解释性文字,使用华文楷体小四号蓝色字体显示?实例的解释性文字?系统或程序输出,使用浅蓝色底纹表示系统或者程序输出??特别需要注意和标注的地方,将以笑脸符号专门表示?????看我可爱吗?三、?????基本正则表达式正则表达式中,26个英文字符代表它们本身,但是下面表格中的特殊字符则赋予了更多不同的含义,一定要记住它们,因为它们是一切正则表达式的基础特殊字符简要说明.一个点,匹配任意一个字符*星号,匹配前面模式中的零个或者任意个+加号,匹配前面模式中的一个或者任意个?问号,匹配前面模式中的零个或者一个()括号,创建一个子模式|竖号,交替匹配[]中括号,用来表示一个区间^尖号,将一个模式挂靠在要匹配的字符串的最前面$美元号,将一个模式挂靠在要匹配的字符串的最后面别看基本正则表达式就是这么9个符号,但是想完全理解和用好它们,还是很困难的,为了加深理解,我来详细的说明一下,这也是我自己学习时的理解和心得,请仔细的阅读。这些符号的作用需要多方位理解,我大概是根据符号所属的类型以及它们所起的作用这2个方向来理解它们的。按照类型划分,上面表格中的特殊字符分为几个类型:字符关键字:这部分关键字包括26个英文字符(上面的表格没有列出来)。这些关键字的特点就是它们匹配自身。数量关键字:这部分关键字包括?.?(点)?*?(星号)?+?(加号)???(问号)这4个关键字,这中间?.?(点)这个关键字稍微特殊一点,因为它有2个作用:既可以作为字符关键字表示任何字符,又可以作为数量关键字代表1个字符。?【任何字符】这个含义很深,因为——空字符也算任何字符,也就是说一个点可以表示有一个字符,也可以表示没有字符,这个概念是新手很容易犯错的地方。数量关键字本身没有任何用处,它必须和【模式】这个概念一起共同作用,在正则表达式中,【模式】可以说是最为核心也最为广泛的内容。总体来说,模式就是用来表示自己想匹配字符的方法,但实际上模式的概念要更为复杂和广泛,这部分内容我会在后面有更详细的描述,就现在来说,你只要理解,数量关键字必须与模式一起共用就可以了。模式关键字:()(括号)?|?(竖号)?[]?(中括号)?^?(尖号)?$?(美元号)这5个符号都属于模式关键字,它们要么代表模式本身(括号、竖号、中括号),要么作用于模式为模式提供其他更高级的功能(尖号、美元号)。?现在,我们从另一个角度来看这些关键字,下面的内容,详细说明这9个关键字所起的作用以及实际表达方法,这部分会有一些比较详细的说明和实例,但是在此之前,我们必须了解一下什么是模式:?什么是模式?模式就是一组用来匹配字符的关键字集合,一个最小的模式只有一个关键字,而大的模式则可以有无数个关键字:A??????这是一个模式,代表A这个字符本身A+?????这也是一个模式,代表一个或者任意多个A字符正则表达式中,数量关键字都是作用于左边模式的,上面的例子中,A是一个没有数量关键字的模式,而A+中的+号就向左作用于前面这个A模式,如果没有A这个模式,+号本身是没有任何意义的,这里A虽然是一个字符,但是我觉得把A称为模式能更清楚的理解模式的含义。正则表达式的核心就是对模式的掌握和操作,理解了模式就等于拿到了开启大门的钥匙。这里我介绍一个TCL语言中的命令:regsub,这个命令的作用就
文档评论(0)