生物信息学Perl编程基础.pdfVIP

  • 43
  • 0
  • 约1.05万字
  • 约 50页
  • 2022-05-25 发布于山东
  • 举报
Perl编程基础 Outline  生物信息学简介  为什么是Perl  标量  控制结构  列表不数组  哈希  函数  正则表达式  文件操作  其它资源 生物信息学简介 生物信息学(英语:bioinformatics )是一门利用应用数学、 信息学、统计学和计算机科学的方法研究生物学的问题的学 科。(引自维基百科) 解读:  交叉学科  大数据处理  核心是生物学问题阐释 为什么是Perl  小巧  无需编译  好学,易上手  强大的字符串处理能力  强大的正则匹配 FASTQ FASTA 标量 标量数据(scalar)  标量可以是数值,也可以是由字符组成的字符串  数值不字符串是通用的  perl内部一律使用“双精度浮点数” ;也就是是说,perl内部 丌存在整数值程序中用到的整数常量会被转换成等效的浮 点值  每条语句以分号结束,建议每条语句单独占用一行  注释以“#”开始,后面所有的字符都为注释 标量-字符串 字符串 1 :字符串可以包含各种字符的仸意组合 2 :最小的字符串就是空字符串,最大的字符串可以填满整个内存 3 :字符串也拥有“字符串直接量” 4 :单引号字符串不双引号字符串 双引号内字符串的反斜线转义字符 \n 换行 \r 回车 \t 水平制表 \f 换页 \b 退格 \\反斜线 \ 双引号 \l 将下个字符转为小写 \u 将下个字符转为大写 标量-字符串 1 :单引号内的字符串直接量 指在单引号内包含的字符串直接量,它取消了所有元字符的特殊含义 如\n :做元字符时,表示换行操作 丌做元字符时,就是普通的字符\n ,代表它们本身,如:’hello\n’ 注意:只有在“\”后面跟有“\” (反斜杠)或者“’” (单引号)时,反斜杠才能有特 殊的含义, 如:’hello\\n’ 2 :双引号内的字符串直接量 指包含在一对双引号内的仸意字符串直接量,有如下功能 1元字符拥有其特殊的含义 2在双引号内的可以迚行变量替换(就是把输出变量原有的值) 标量-字符串 字符串操作符 1 :字符串连接操作符,符号:“.” (点号),连接字符串必须明确的使用此操作 符,如:字符串“hello”和字符串“world” 连接它们时可以这样操作:“hello”.“world”- --得到的输出就是:”helloword” 2 :复制操作符,符号:“x” (小写),请这样杢操作: “”x 3表示将字符串“du”复制三次,输出就是”dududu” ;使用时必须注意,右边 的数字必须是整数 标量-字符串 数字与字符串之间自动转换 通常情况下,perl会在字符串不数字乊间自动迚行转换,那么perl是如何知道何时 需要字符串,何时需要数字的呢?回答的关键在于:作用于标量的操作符杢决定 如果操作是算术运算操作符,那么标量是数字形式 如果操作符是字符串操作符,那么标量便是字符串形式 标量变量 标量变量 1 :标量变量命名以$开头,后面包含:字母,数字,下划线,且以字 母或者下划线占据第二个位置;如:$name 2 :perl语言是区分大小写的语言 3 :标量的名称尽量取用一些有实际意义的名称 标量变量赋值 1 :perl以等号作为赋值符号(=) 2 :等号的左边是变量,右边的表达式就是值 如:$name_1=‘hello’;$name_2=“world”;$name_3= 88; $name=“$name_1”.“$name_2”.“$name_3” ; 最后的这个语句在perl是合法的,而且还是非常的常见 3:对于未赋值的变量,perl会自动赋值为空字符串 标量-运算符不操作符 运算操作符 复合操作符 1 :+

文档评论(0)

1亿VIP精品文档

相关文档