正则表达式的原理和实践.pptVIP

  • 5
  • 0
  • 约4.31千字
  • 约 24页
  • 2017-12-30 发布于湖北
  • 举报
正则表达式的原理和实践

正则表达式学习与实践 讲解人: 冷荣秋 引言: 当今各种文本信息急剧增长,有固定格式的、没有固定格式的或者是在两者之间。有时由于应用的需要,有待对已有的数据进行计算机软件自动化信息提取或者人为地加工整理。面对海量的文本数据,可能要耗费许多人宝贵的时间,夜以继日地工作进行整理,期间可能还会产生无数的人为错误。而机器加工的好处就是只要它能够被正确的识别就不会产生误差,且速度也快的惊人。这就是强大的正则表达式所表现出来的神奇效果,我们对一部书本厚达2000多页的txt文本的牛津词典进行过加工,通过调试正则表达式代码来达到加工的目的,工作效率得以大幅度提升。 正则表达式解释器主要有3部分组成,分别是解析、编译与执行。 正则表达式可以用来: 验证字符串是否符合指定特征,比如验证是否是合法的邮件地址。 用来查找字符串,从一个长的文本中查找符合指定特征的字符串,比查找固定字符串更加灵活方便。 用来替换,比普通的替换更强大。 非确定有穷自动机(NDFA): Ken Thompson利用非确定有穷自动机(NDFA)构造了正则表达式。NDFA是一个有向图,其每个节点代表一个状态,每条边用字母或符号(代表空字符串)标记。自动机有一个初始状态并可能有多个终止或接受状态。正则表达式匹配过程中使用了NDFA,如果在NDFA中,从初始状态到接受状态结束的路径上的字母能匹配文本中的每一个字符串,就

文档评论(0)

1亿VIP精品文档

相关文档