生物信息学基础教程第4讲:正则表达式教程1134汇总1759.pptVIP

  • 5
  • 0
  • 约5.53千字
  • 约 38页
  • 2018-08-12 发布于湖北
  • 举报

生物信息学基础教程第4讲:正则表达式教程1134汇总1759.ppt

生物信息学基础教程第4讲:正则表达式教程1134汇总1759.ppt

awk脚本的运行机制 如果存在BEGIN区块,执行其中的actions 从输入文件中读取一行,称为读入一条记录 将读入的记录按照分隔符(FS/IFS)分割为多个字段,依次为$1,$2,…., 而$0表示整条记录。 将当前输入记录与awk_pattern相比较,如果匹配则执行actions,如果不匹配则跳过读入下一条记录,重复执行3,4,直到文件尾 awk把输入文件的数据读入内存,然后操作内存中的输入数据副本,不会修改输入文件的内容 awk总是输出到标准输出,如果需要输出到文件,可采用重定向 * fhfgh awk_pattern的格式 正则表达式 /regexp/ 通用的正则元字符: [] ^ $ . | () * +是awk特有的元字符,匹配其前的单个字符一次以上 ?也是awk特有的元字符,匹配其前的单字符0/1次 举例:awk ‘/*\$0\.[0-9][0-9].*/’ input_file 布尔表达式 “==”,“”, “~/regexp/”,“”, “||” 举例 awk ‘$3 ~ /[^d]/’ input_file awk ($1 10 ) ($2 10) {print ok} input_file * fhfgh actions的格式 actions是对awk读取记录进行的操作 actions由一条或多条语句或命令组成,语句之间用分号分隔 * fhf

文档评论(0)

1亿VIP精品文档

相关文档