模式匹配(正则表达式)概要1.pptVIP

  • 1
  • 0
  • 约1.15万字
  • 约 55页
  • 2017-07-23 发布于湖北
  • 举报
模式匹配(正则表达式)概要1

Perl语言程序设计 正则表达式(Regular?Expression) 一、简介 ? 模式指在字符串中寻找的特定序列的字符,由斜线包含:/def/即模式def。其 用法如结合函数split将字符串用某模式分成多个单词:@array = split(/ /, $line); 二、匹配操作符 =~、!~ ?? =~:检验匹配是否成功:$result = $var =~ /abc/;若在该字符串中找到了该模式,则返回非零值,即true,不匹配则返回0,即false。 !~:则相反。 ?? 这两个操作符适于条件控制中,如: ?? if ($question =~ /please/) { ???? print (Thank you for being polite!\n); ?? } ?? else { ???? print (That was not very polite!\n); ?? } 三、模式中的特殊字符 ?? PERL在模式中支持一些特殊字符,可以起到一些特殊的作用。 1、字符“ +” ?? “+”:意味着一个或多个相同的字符,如:/de+f/指def、deef、deeeeef等。它尽量匹配尽可能多的相同字符,如/ab+/在字符串abbc中匹配的将是abb,而不是ab。 ?? 当一行中各单词间的空格多于一个时,可以如下分割: ???? @array = split (/ +/, $line); 注:split函数每次遇到分割模式,总是开始一个新单词。 (1)若$line以空格打头,则@array的第一个元素即为空元素。但其可以区分是否真有单词。 (2)若$line中只有空格,则@array则为空数组。且上例中TAB字符被当作一个单词。注意修正。 2、字符 [ ]和[^] ?? [ ]:意味着匹配一组字符中的一个,如/a[0123456789]c/将匹配a加数字加c的字符串。与+联合使用例:/d[eE]+f/匹配def、dEf、deef、dEf、dEEEeeeEef等。 ^:表示除其之外的所有字符,如:/d[^eE]f/匹配d加非e字符加f的字符串。 3、字符 *和? ?? 它们与+类似,区别在于 *:匹配0个、1个或多个相同字符,?:匹配0个或1个该字符。如/de*f/匹配df、def、deeeef等;/de?f/匹配df或def。 4、转义字符 ?? 如果你想在模式中包含通常被看作特殊意义的字符,须在其前加斜线“\”。如:/\*+/中\*即表示字符*,而不是上面提到的一个或多个字符的含义。斜线的表示为/\\/。在PERL5中可用字符对\Q和\E来转义。 5、匹配任意字母或数字 ?? 上面提到模式/a[0123456789]c/匹配字母a加任意数字加c的字符串,另一种表示方法为:/a[0-9]c/,类似的,[a-z]表示任意小写字母,[A-Z]表示任意大写字母。任意大小写字母、数字的表示方法为:/[0-9a-zA-Z]/。 例1: /^def/:只匹配以def打头的字符串; /def$/:只匹配以def结尾的字符串; /^def$/:只匹配字符串def(?)。 \A和\Z在多行匹配时与^和$不同。 ?? 例2:检验变量名的类型: ???? if ($varname =~ /^\$[A-Za-z][_0-9a-zA-Z]*$/) { ?????? print ($varname is a legal scalar variable\n); ???? } elsif ($varname =~ /^@[A-Za-z][_0-9a-zA-Z]*$/) { ?????? print ($varname is a legal array variable\n); ???? } elsif ($varname =~ /^[A-Za-z][_0-9a-zA-Z]*$/) { ?????? print ($varname is a legal file variable\n); ???? } else { ?????? print (I dont understand what $varname is.\n); ????} 例3:\b在单词边界匹配: /\bdef/匹配def和defghi等以def打头的单词,但不匹配abcdef; /def\b/匹配def和abcdef等以

文档评论(0)

1亿VIP精品文档

相关文档