第三章 序 列 比 较 序列比较的根本任务是: 发现序列之间的相似性 辨别序列之间的差异 目的: 相似序列 ? 相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 第一节 序列的相似性 同源(homology)- 具有共同的祖先 直向同源(Orthologous ) 共生同源(paralogous ) 相似(similarity) —同源序列一般是相似的 — 相似序列不一定是同源的 — 进化趋同(同功能) 序列的相似性描述 定性的描述 定量的数值 相似度 距离 序列比较的基本操作是比对(Alignment) 两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列 。 1、字母表和序列 字母表 4字符DNA字母表: A, C, G, T 扩展的遗传学字母表或IUPAC编码 单字母氨基酸编码 1、字母表和序列 特定的符号 ? ? — 代表字母表 A* — 代表由字母表A中字符所形成的一系列有限长度序列或字符串或序列的集合 ? a、b、c—代表单独的字符 ? s、t、u、v—代表A*中的序列 ? |s|—代表序列s的长度 为了说明序列s子序列和s中单个字符,在s中各字符之间用数字标明分割边界 例如,设s ACCACGTA,则s可表示为 0A1C2C3A4C5G6T7A8 i:s:j 指明
原创力文档

文档评论(0)