PHP入门培训教程_PHP培训教程_PHP基础教程16_PHP正则.pptVIP

  • 3
  • 1
  • 约 40页
  • 2016-08-25 发布于重庆
  • 举报

PHP入门培训教程_PHP培训教程_PHP基础教程16_PHP正则.ppt

PHP入门培训教程_PHP培训教程_PHP基础教程16_PHP正则

回顾 字符串的定义都有哪三种方式,简单区别? 常用的字符串的输出函数都有哪些? 常用的字符串的比较函数都有哪些? 常用的字符串的格式化函数都有哪些? 预习检查 使用正则表达式可以实现字符串的哪些操作? 正则表达式中的元字符都有哪些? 与Perl兼容的正则表达式都有哪些操作函数? 本章任务 1. 正则表达式简介 2. 正则表达式的语法规则 3. 与Perl兼容的正则表达式函数 1. 正则表达式介绍 正则表达式简介: 正则表达式是用于描述字符排列和匹配模式的一种语法规则。它主要用于字符串的模式分割、匹配、查找及替换操作。到目前为止,我们前面所用过的精确(文本)匹配也是一种正则表达式。 在PHP中,正则表达式一般是由正规字符和一些特殊字符(类似于通配符)联合构成的一个文本模式的程序性描述。 PHP中,正则表达式有三个作用: 匹配,也常常用于从字符串中析取信息。 用新文本代替匹配文本。 将一个字符串拆分为一组更小的信息块。 一个正则表达式中至少包含一个原子。 在PHP中有两套正则表达式函数库,两者功能相似,只是执行效率略有差异: 一套是由PCRE(Perl Compatible Regular Expression)库提供的。使用“preg_”为前缀命名的函数; 一套由POSIX(Portable Operating System Interface of Unix )扩展提供的。使用以“ereg_”为前缀命名的函数; PCRE来源于Perl语言,而Perl是对字符串操作功能最强大的语言之一,PHP的最初版本就是由Perl开发的产品。 PCRE语法支持更多特性,比POSIX语法更强大。 举例:想一想这两个正则表达式做什么用? /^-?\d+$|^-?0[xX][\da-fA-F]+$/ /^[0-9a-zA-Z_-]+@[0-9a-zA-Z_-]+(\.[0-9a-zA-Z_-]+){0,3}$/ 与Perl语言兼容的正则表达式处理函数 函数名 功能描述 preg_match() 进行正则表达式匹配 preg_match_all() 进行全局正则表达式匹配 preg_replace() 执行正则表达式的搜索和替换 preg_split() 用正则表达式分割字符串 preg_grep() 返回与模式匹配的数组单元 preg_replace_callback 用回调函数执行正则表达式的搜索和替换 2. 正则表达式的语法规则 2.1 定界符 2.2 原子 2.3 元字符 2.4 模式修正符 Perl兼容正则表达式 正则表达式作为一个匹配的模版,是由原子(普通字符,例如字符a到z)、特殊字符(元字符,例如*、+和?等)、以及模式修正符三部分组成的文字模式。 一个最简单正则表达式至少包含一个原子。 将下面的正则表达式拆分如下: /a.*?(?:|\\t|\\r|\\n)?href=[\]?(.+?)[\]?(?:(?:|\\t|\\r|\\n)+.*?)?(.+?)\/a.*?/sim 定界符:两个斜线”/”。 原子用到了 a href = ‘ “ / 等普通字符和\t \r \n等转义字符 元字符使用了 [] () | . ? * + 等具有特殊含义的字符 用到了模式修正符是在定界符最后一个斜线之后的三个字符: s i m 2.1 定界符 在程序语言中,使用与Perl兼容的正则表达式,通常都需要将模式表达式放入定界符之间,如“/”。 作为定界符常使用反斜线“/”,如“/apple/”。用户只要把需要匹配的模式内容放入定界符之间即可。作为定界的字符也不仅仅局限于“/”。除了字母、数字和斜线“\”以外的任何字符都可以作为定界符,像 ‘#’、’|’、’!’ 等都可以的。 /\/\w+/ --使用反斜线作为定界符合法 |(\d{3})-\d+|Sm --使用竖线”|”作为定界符合法 !^(?i)php[34]! --使用竖线”!”作为定界符合法 {^\s+(\s+)?$} --使用竖线”}”作为定界符合法 /href=‘(.*)’ --非法定界符,缺少结束定界符 1-\d3-\d3-\d4| --非法定界符,缺少其实定界符 2.2 原子 原子是正则表达式的最基本的组成单元,而且在每个模式中最少要少包含一个原子。原子是由所有那些未显示指定为元字符的打印和非打印字符组成,具体分为5类。 1. 普通字符作为原子: 如 a~z、A~Z、0~9 等 2. 一些特殊字符和转义后元字符作为原子: 所有标点符号,但语句特殊意义的符号需要转义后才可作为原子,如:\” \’ \* \+ \? \. 等 3. 一些非打印字符作为原子: 如:\f \n \r \t \v \cx 4. 使用“通用

文档评论(0)

1亿VIP精品文档

相关文档