网站大量收购独家精品文档,联系QQ:2885784924

生物信息学基础教程第4讲:正则表达式教程培训演示课件.ppt

生物信息学基础教程第4讲:正则表达式教程培训演示课件.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
awk自定义变量 定义变量:varname=value 表达式中不带引号的字符串即被视为变量,如果之前未被赋值,默认值为0或“” 用法:awk awk_script awkvar1=value1 awkvar2=value2 .... input_file 优先级:awk_script中的变量定义优先于命令行中的变量定义 如果需要调用shell变量,可以采用awk awk_script awkvar1=shellvar1 awkvar2=shellvar2 .... input_file * awk内置函数 数值函数: int(x), sqrt(x), exp(x), log(x), sin(x), cos(x), atan2(y,x), rand(), srand(x), srand() 字符串函数: index(in, find), length(s), match(s, r), sprintf(), sub(p,r,t), gsub(p,r,t), substr(str, st, len), split(s,a,fs), tolower(str), toupper(str) 系统函数: close(filename), system(command) * awk自定义函数 自定义函数格式: function fun_name(param_list) { function_body } 举例: awk ‘{ print “sum=”, SquareSum($1, $2) } function SquareSum(x,y) { sum=x*x+y*y; return sum }’ grade.txt * awk数组 访问数组元素 for ( element in array_name ) print array_name[element] 举例: awk ‘BEGIN{print split(“123#456#789”, mya, “#”); for ( i in mya ) { print mya[i] }}’ * 避免awk错误的方法 ① 确保整个awk_script用单引号括起来 ② 确保awk_script内所有引号成对出现 ③ 确保用花括号括起动作语句,用圆括号括起条件语句 ④ 可能忘记使用花括号,也许你认为没有必要,但awk不这样认为,将按之解释语法 ⑤ 如果使用字符串,一定要保证字符串被双引号括起来(在模式中除外) * 2) 在awk中,设置有意义的变量名是一种好习惯,在进行模式匹配或关系操作时更容易理解。一般的变量名设置方式为name=$n 3) 通常在BEGIN部分给一些变量赋值是很有益的,这样可以在awk表达式进行改动时减少很多麻烦 4) awk的基本功能是根据指定规则抽取输入数据的部分内容并输出,另一个重要的功能是对输入数据进行分析运算得到新的数据并输出,这是通过在 awk_script中对字段变量($1、$2、$3...)重新赋值或使用更大的字段变量$n(n大于当前记录的NF)而实现的 5) 使用字符串或正则表达式时,有时需要在输出中加入一新行或查询一元字符。这时就需要字符串屏蔽序列。awk中经常使用的屏蔽序列有: \b 退格键 \t tab键 \f 走纸换页 \ddd 八进制值 \n 新行 \r 回车键 \c 任意其他特殊字符。eg: \\为反斜线符号 * awk的输出函数printf ① 格式: printf (输出模板字符串, 参数列表) ② 参数列表是以逗号分隔的列表,参数可以是变量、数值或字符串。 ③ 输出模板字符串的字符串中必须包含格式控制符,有几个参数就要求有几个格式控制符。模板字符串中可以只有格式控制符而没有其它字符。 ④ 格式控制符: %[-][width][.prec]fmt % : 标识一个格式控制符的开始,不可省略。 - : 表示参数输出时左对齐,可省略。 width : 一个数字,表示参数输出时占用域的宽度,可省略。 .prec : prec是一个数值,表示最大字符串长度或小数点右边的位数,可省略。 fmt : 一个小写字母,表示输出参数的数据类型,不可省略。 ⑤ 常见的fmt : c ASCII字符, d 整数 ,e 科学记数法浮点数, f 浮点数,如 123.44 g 由awk决定使用哪种浮点数转换e或f ,o 八进制数, s 字符串, x 十六进制数 ⑥ 举例: echo 65 | awk { printf (%c\n,$0) } // 将打印 A awk BEGIN{printf %.4f\n,999} //将打印 999.0000 awk BEGIN{printf 2 number:%8.4f%8.2f,999,888}

您可能关注的文档

文档评论(0)

liuhan98 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档