正则(二).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络爬虫系列讲座 C#正则表达式应用 回顾 \w、\s、\d、\xn、\un 含义? (), (?:), (?=), [ ] 含义? *, +, ?, {n}, {n,}, {n,m} 限定符的作用? ^, $ 的作用? 回顾 本章目标 正则表达式在 C# 中的实现 了解 C# 中正则对像、集合等。 理解并编写常见的正则表达式 正则表达式中的子表达式 匹配词组并获取该匹配(在 C# 中称为“捕获组”): (Win98|Win2K|WinXP) 匹配某个文本中的 Win98 或 Win2K 或 WinXP 字符串 ,并获取该匹配 string input = ……我的操作系统是 WinXP 专业版……; string pattern = 我的操作系统是\\s*(Win98|Win2K|WinXP)\\s*(\\S+) 版; Match match = Regex.Match(input, pattern); Console.WriteLine(match.Value); Console.WriteLine(match.Groups[1].Value); Console.WriteLine(match.Groups[2].Value); 输出: 我的操作系统时 WinXP 专业版 WinXP 专业 C# 中正则对像、集合等 正则对像在 System.Text.RegularExpressions 命名空间中,在该命名空间下放置着正则类、捕获结果类和捕获结果的集合类,以及委托和枚举。下面是最常用到的类: Regex 表示不可变的正则表达式 RegexOptions 枚举,提供用于设置正则表达式选项的枚举值 Match 表示单个正则表达式匹配的结果。 MatchCollection 表示通过以迭代方式将正则表达式模式应用于输入字符串所找到的成功匹配的集合 Group 表示单个捕获组的结果 GroupCollection 表示捕获组的集合,单个匹配中的捕获组的集合 C# 中正则对像、集合等 Match 类。表示单个正则表达式匹配的结果,由于单个匹配可能涉及多个捕获组(子表达式),因此 Match 具有返回 GroupCollection 的 Groups 属性。 MatchCollection 类。表示通过以迭代方式将正则表达式模式应用于输入字符串所找到的成功匹配的集合 。我们调用 Regex.Matches 方法时,返回的就是 MatchCollection 类实例。 C# 中正则对像、集合等 Group 类。Group 类从 Capture 继承。表示单个捕获组的结果。由于存在数量词,一个捕获组可以在单个匹配中捕获零个、一个或更多的字符串,因此 Group 提供 Capture 对象的集合(即 Group 实例本身等效于由 Captures 属性返回的集合中的最后一项 )。 GroupCollection 类。表示捕获组的只读集合,返回单个匹配中的捕获组的集合。当我们使用子表达式捕获到结果时,就会放入到 GroupCollection 集合中。 C# 中正则对像、集合等 RegexOptions 枚举。 Compiled 指定将正则表达式编译为程序集。这会产生更快的执行速度,但会增加启动时间。 CultureInvariant 指定忽略语言中的区域性差异。有关更多信息,请参见 在 RegularExpressions 命名空间中执行不区分区域性的操作。 ECMAScript 为表达式启用符合 ECMAScript 的行为。该值只能与 IgnoreCase、Multiline 和 Compiled 值一起使用。该值与其他任何值一起使用均将导致异常。 ExplicitCapture 指定有效的捕获仅为形式为 (?name...) 的显式命名或编号的组。这使未命名的圆括号可以充当非捕获组,并且不会使表达式的语法 (?:...) 显得笨拙。 C# 中正则对像、集合等 IgnoreCase 指定不区分大小写的匹配。 IgnorePatternWhitespace 消除模式中的非转义空白并启用由 # 标记的注释。但是IgnorePatternWhitespace 值不会影响或消除字符类中的空白。 Multiline 多行模式。更改 ^ 和 $ 的含义,使它们分别在任意一行的行首和行尾匹配,而不仅仅在整个字符串的开头和结尾匹配。 None 指定不设置选项。 RightToLeft 指定搜索从右向左而不是从左向右进行。 Singleline 指定单行模式。更改点 (.) 的含义,使它与每一个字符匹配(而不是与除 \n 之外的每个字符匹配)。 C# 中正则对像、集合等 Regex 类。

文档评论(0)

803322fw + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档