网站大量收购独家精品文档,联系QQ:2885784924

浅析正则表达式.pptVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
崔嘉佳 陈甜 贾玮 张耀方 房晓孟 目录 正则表达式作用 正则表达式内容 正则表达式用法 内容 正则表达式,Regular Expression(也称为“regex”或“regexp”),是一种用来描述文本模式的特殊语法。一个正则表达式由普通字符(例如字符“a”到“z”)以及特殊字符(称为元字符,如“\”、“*”、“?”等)组成。简单地说,一个正则表达式就是你需要匹配的字符串。例如,正则表达式“A*B”匹配字符串“ACCCB”但是不匹配“ACCCC”。 正则表达式定义 内容 元字符 通配符 限定符 定位符 表示范围和选择的元字符 转义符 非捕获元字符 …… 如何构造正则表达式 构造正则表达式的方法和创建数学表达式的方法一样。也就是用多种元字符与操作符将小的表达式结合在一起来创建更大的表达式。正则表达式的组件可以是单个字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。 正则表达式作用 搜索/匹配 替换 验证数据格式 验证数据有效性 数据分析 …… 字符串的搜索、匹配 字符串对象的方法中,“search”和“match”方法用来搜索字符串中对应的内容。 “search”方法的语法是: intIndex = stringObject.search(rgExp); 下面是一个简单的“search”方法使用示例: function SearchTest(){ var r, re; var s = The quick brown FireFox jumps over a lazy dog.; re = /firefox/i; r = s.search(re); return(r); } 字符串的替换 字符串对象有着“replace”方法,用来替换字符串中某些部分。“replace”方法的语法为: strValue = stringObject.replace(rgExp, replaceText); 正则表达式类库 输入文字 在此Boost.regex,动态正则表达式 Boost.spirit,静态正则表达式 Boost.xpressive,动态和静态正则表达式 TPL(Text Processing Library),静态正则表达式 …… 正则对象的属性 正则表达式对象的属性有4个:“global”,“ignoreCase”,“multiline”和“source”。其引用的语法为: booleanValue = regObject.global; booleanValue = regObject.ignoreCase; booleanValue = regObject.multiline; booleanValue = regObject.source; 我们的大作业: 当今世界 当下社会人普遍存在“亚健康”的状态,可是快节奏的生活使人们无法停下来去了解健康,无法停下来去了解如何养生。而追求高品质的健康生活已经成为当下生活的主流。 21世纪,是互联网的时代,信息量大,我们的“氧吧”的宗旨就是在海量化的网络信息里面使人们快速的获取高权威的健康养生知识 我们的大作业: 当今世界 通过深度搜索的方法,在三个微博(腾讯、网易、新浪)里面抓取有关健康养生的信息,通过一定的算法将抓取来的信息进行权威性排序和去重。 另一方面,我们在几个关键性的健康养生网站进行网页抓取,在我们的“氧吧”里面开辟出一个当下健康养生的热点话题,让人们在短时间内获取最新消息。 抓取软件:通过学长的推荐,我们用火车头采集器进行信息抓取,目前正在学习这个软件。 谢谢观赏

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档