正则表达式和字符串处理8.docxVIP

  • 8
  • 0
  • 约9.99千字
  • 约 8页
  • 2018-06-22 发布于江苏
  • 举报
正则表达式和字符串处理8

处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强多少倍。幸运的是R语言的可扩展能力很强,DNA/RNA/AA等生物序列现在已经可以使用R来处理。R语言处理文本的能力虽然不强,但适当用用还是可以大幅提高工作效率的,而且有些文本操作还不得不用。高效处理文本少不了正则表达式(regular expression),虽然R在这方面先天不足,但它处理字符串的绝大多数函数还都使用正则表达式。Table of Contents1 正则表达式简介2 字符数统计和字符翻译2.1 nchar和length2.2 tolower,toupper和chartr3 字符串连接3.1 paste函数4 字符串拆分4.1 strsplit函数5 字符串查询:5.1 grep和grepl函数:5.2 regexpr、gregexpr和regexec6 字符串替换6.1 sub和gsub函数7 字符串提取7.1 substr和substring函数8 其他:8.1 strtrim函数8.2 strwrap函数8.3 match和charmatch1?正则表达式简介正则表达式不是R的专属内容,这里只做简单介绍,更详细的内容请查阅其他文章。正则表达式是用于描述/匹配一个文本集合的表达式:所有英文字母、数字和很多可

文档评论(0)

1亿VIP精品文档

相关文档