- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
正则表达式基础入门教程
则表达式基础入门教程
日期:2007-8-1 15:34:51 出处:unibetter 学生社区 作者:deerchao 人气: 39
目录
1. 本文目标
2. 如何使用本教程
3. 正则表达式到底是什么?
4. 入门
5. 测试 则表达式
6. 元字符
7. 字符转义
8. 重复
9. 字符类
10. 反义
11. 替换
12. 分组
13. 后向引用
14. 零宽断言
15. 负向零宽断言
16. 注释
17. 贪婪与懒惰
18. 处理选项
19. 平衡组/递归匹配
20. 还有些什么东西没提到
21. 一些我认为你可能已经知道的术语的参
22. 网上的资源及本文参 文献
23. 更新说明
本文目标
30 分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的
程序或网页里使用它。
如何使用本教程
最重要的是 请给我 30 分钟,如果你没有使用正则表达式的经验,请不要试图在
30 秒内入门。当然,如果你是超人,那自然得另当别论。
别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实
并没有你想像中的那么困难。当然,如果你看完了这篇教程之后,发现自己明白了很多,却
又几乎什么都记不得,那也是很正常的 我认为,没接触过正则表达式的人在看完这篇教
程后,能把提到过的语法记住 80% 以上的可能性为零。这里只是让你明白基本的原理,以
后你还需要多练习,多使用,才能熟练掌握正则表达式。
除了作为入门教程之外,本文还试图成为可以在日常工作中使用的正则表达式语法参
考手册。就作者本人的经历来说,这个目标还是完成得不错的 你看,我自己也没能把所
有的东西记下来,不是吗?
文本格式约定:专业术语元字符/语法格式正则表达式正则表达式中的一部分(用于分
析) 用于在其中搜索的字符串对正则表达式或其中一部分的说明
则表达式到底是什么?
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。
正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。
很可能你使用过Windows/Dos 下用于文件查找的通配符(wildcard),也就是*和?。如
果你想查找某个目录下的所有的Word 文档的话,你会搜 *.doc 。在这里,*会被解释成任
意的字符串。和通配符类似,正则表达式也是用来进行文本匹配的工具,只不过比起通配符,
它能更精确地描述你的需求 当然,代价就是更复杂 比如你可以编写一个正则表达
式,用来查找所有以 0 开头,后面跟着2-3 个数字,然后是一个连字号“-”,最后是7 或8
位数字的字符串(像010-或0376-7654321) 。
正则表达式是用于进行文本匹配的工具,所以本文里多次提到了在字符串里搜 /查
找,这种说法的意思是在给定的字符串中,寻找与给定的正则表达式相匹配的部分。有可能
字符串里有不止一个部分满足给定的正则表达式,这时每一个这样的部分被称为一个匹配。
匹配在本文里可能会有三种意思:一种是形容词性的,比如说一个字符串匹配一个表达式;
一种是动词性的,比如说在字符串里匹配正则表达式;还有一种是名词性的,就是刚刚说到
的“字符串中满足给定的正则表达式的一部分”。
入门
学习正则表达式的最好方法是从例子开始,理解例子之后再自己对例子进行修改,实
验。下面给出了不少简单的例子,并对它们作了详细的说明。
假设你在一 英文小说里查找hi,你可以使用正则正则表达式hi。
这是最简单的正则表达式了,它可以精确匹配这样的字符串:由两个字符组成,前一
个字符是h,后一个是i。通常,处理正则表达式的工具会提供一个忽略 小写的选项,如果
选中了这个选项,它可以匹配hi,HI,Hi,hI 这四种情况中的任意一种。
不幸的是,很多单词里包含 hi 这两个连续的字符,比如him,history,high 等等。用hi
来查找的话,这里边的hi 也会被找出来。如果要精确地查找hi 这个单词的话,我们应该使
用\bhi\b 。
\b 是正则表达式规定的一个特殊代码 (好吧,某些人叫它元字符,metacharacter ),
代表着单词的开头或结尾,也就是单词的分界处。虽然通常英文的单词是由空
您可能关注的文档
最近下载
- 2025年湖南铁道职业技术学院单招职业适应性测试试题及答案解析2025.pdf VIP
- 阿莫西林克拉维酸钾片在犬体内的生物等效性研究.pdf
- 新项目方法能力验证报告(水质粪大肠菌群的测定多管发酵法).docx
- TCECS 616-2019 隧道施工超前地质预报技术规程.docx VIP
- 妇幼保健信息系统基本功能规范.pdf VIP
- SL27-2014 水闸施工规范.docx VIP
- DB5305T 78-2022保山市牛油果园水肥一体化技术规程.docx VIP
- 团结路下穿隧道工程地质详勘报告.docx VIP
- 水平定向钻施工规范.pdf VIP
- 2024年高考作文素材积累之央视主持人大赛2023第二期、第三期金句合集及选手展示文稿.docx VIP
文档评论(0)