- 1、本文档共42页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
gnu c 规则表达式入门(the gnu c 规则表达式入门)
gnu c 规则表达式入门(the gnu c 规则表达式入门)
GNU C规则表达式入门
童建(tongjian@)[网友投稿]
用过Perl的朋友应该都它提供了规则表达式功能,所以使得用Perl进行文本处
理非常方便。本人最近试用了一下
GNU C的规则表达式功能,
发现使用起来也很简单,只是觉得支持的不够强大,不能够进行文本的替换,只
能进行文本的查找,至少目前我是
没有发现基于规则表达式的
文本替换功能。
下面我就简单的介绍一下GNU C的规则表达式使用方法,有理解不对的地方,还
请朋友们多指正。
在GNU C中要使用规则表达式,需要用到以下几个函数。(定义在/ usr /包括
E / H文件中)正则表达式。
* int regcomp(regex_t *编译,const char *模式,int CFLAGS)
* int值(regex_t *编译,字符串的长度,size_t,regmat
ch_t matchptr [],int
的状态)
*无效regfree(regex_t *编译)
* size_t regerror(int errcode,regex_t *编译字符串缓冲区,大小
_t长度)
下面我就介绍分别一下这几个函数和它用到的一些数据类型。
1.int regcomp(regex_t *编译,const char *模式,int CFLAGS)
这个函数把指定的规则表达式模式编译成一种特定的数据格式编译,这
样可以使匹配更有效。函数
会使用这个数据在目标文值
本串中进行模式匹配执行成功返回0。
regex_t是一个结构体数据类型,用来存放编译后的规则表达式,它的成员re_
用来存储规则表达式中的子N衬底
规则表达式的个数,子规则表
达式就是用圆括号包起来的部分表达式。
模式是指向我们写好的规则表达式的指针。
目的有如下4个值或者是它们或运算(|)后的值:
reg_extended以功能更加强大的扩展规则表达式的方式进行匹配。
reg_icase匹配字母时忽略大小写。
reg_nosub不用存储匹配后的结果。
reg_newline识别换行符,这样$就可以从行尾开始匹配,“^”就可以从行的开
头开始匹配。
2。int值(regex_t *编译,字符串的长度,size_t,弹裂蒴果
tch_t matchptr [],int
的状态)
当我们编译好规则表达式后,就可以用regexec匹配我们的目标文本串了,如果
在编译规则表达式的时候没有指
定CFLAGS的参数为
reg_newline,则默认情况下是忽略换行符的,也就是把整个文本串当作一个字
符串处理执行成功返回0。
regmatch_t是一个结构体数据类型,成员rm_so存放匹配文本串在目标串中的
开始位置,rm_eo存放结束位
置。通常我们以数组的形式定义
一组这样的结构。因为往往我们的规则表达式中还包含子规则表达式数组0单。
元存放主规则表达式位置,后边的
单元依次存放子规则表达式位
置。
是已经用函数编译好的规则表达式regcomp编译。
字符串是目标文本串。
是regmatch_t结构体数组的长度长度。
matchptr regmatch_t类型的结构体数组,存放匹配文本串的位置信息。
有两个值标志
reg_notbol按我的理解是如果指定了这个值,
It will not ^ from our goal on
Initial matching. In a word, Im not very well up to now
Understand the significance of this parameter,
Text as follows:
If, this, bit, is, set, then, the, beginning-of-line, operator, doesnt, match
The beginning of the
String (presumably
Because, its, not, beginning, of, a, line,.If, not, set, then, the, beginn, the
Ing-of-line operator
Does match the beginning
Of the string.
REG_NOTEOL is similar to the one above, but this specifies the end of the end of line.
3. void regfree (regex_t *compiled)
When we use the compiled regular expressions, or recompile other regular ex
您可能关注的文档
- b基本概念基础理论知识模块(B basic concept, basic theory, knowledge module).doc
- c 题集1_填空(C question sets 1_ fill in the blanks).doc
- c 语言概述(C Language Overview).doc
- c 程序的存储结构(Storage structure of C program).doc
- c++教学大纲(The c++ syllabus).doc
- c++_time类(Class c++_time).doc
- c++术语中英对照(C++ terms in English and Chinese).doc
- c++中const用法总结(Summary of const usage in c++).doc
- c++程序设计论文(C++ programming papers).doc
- c++简单反射代码(C++ simple reflection code).doc
文档评论(0)