- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
东南大学 吴健雄实验室ppt整理
第三节 序列多重比对 1、SP(Sum-of-Pairs)模型 2、多重比对的动态规划算法 3、 优化计算方法 4、星形比对 星形比对的基本思想是:在给定的若干序列中,选择一个核心序列,通过该序列与其它序列的两两比对形成所有序列的多重比对?,从而使得?在核心序列和任何一个其它序列方向的投影是最优的两两比对。 利用标准的动态规划方法求出所有si和sc的最优两两比对 时间为O(kn2) 将这些两两比对聚集起来 并采用“只要是空白, 则永远是空白”的原则。 sc s1 s2 … sk 如何选择核心序列? 尝试将每一个序列分别作为核心序列,进行星形多重序列比对,取比对结果最好的一个。 另一种方法是计算所有的两两比对,取下式值最大的一个: ? sim( si, sc ) 例如,有5个序列: s1 = ATTGCCATT s2 = ATGGCCATT s3 = ATCCAATTTT s4 = ATCTTCTT s5 = ACTGACC 5、树形比对 6、其它多重序列比对算法 一般渐进式比对方法所采用的过程: (1)先将多个序列进行两两比对,基于这些比较,计算得到一个距离矩阵,该矩阵反映每对序列的关系; (2) 利用距离矩阵,建立一棵“相关树”; (3)从最接近的一对序列出发,逐步归并形成比对的聚类,直到所有序列处理完。 例: 目前使用最广泛的多重序列比对程序是ClustalW ClustalW是一种渐进的比对方法,先将多个序列进行两两比对,基于这些比较,计算得到一个距离矩阵,该矩阵反映了每对序列的关系 利用保守序列或者特征统计图可以判断一个序列是否满足一定的特征 给定一个序列s=a1a2…am,定义字符a在第j位的代价为 其中,|A|代表字母表A的长度,Ak代表A的第k个字符,特别地A0代表空缺字符“-”。整个序列s的代价为 多序列比对 EBI的CLUSTALW网址是: http://www.ebi.ac.uk/clustalw/ 7、统计特征分析 对于所得到的多重序列比对,我们往往需要进行归纳分析,总结这些序列的特征,或者给出这些序列共性的表示 —H—LVV G—VLVG GN—LVV LHCLV- VHCL-- (1)保守序列 表示序列每个位置上最可能出现的字符(或者所有可能出现的字符) ATNTSC (N - A,T,C,G ; S - G,C) (2)特征统计图(Profile) 令P=(P1,P2,…,PL),P表示在?的每一列上各种字符出现的概率分布 Pj=(pj0,pj1,…,pj|A|) A代表字母表,Pjk代表字母表A中第k个字符在第 j 列出现的概率。 第0个字符是特殊的空位符号“-”。 ATTAT AACTT CTTAT ACTTT AGAAT 1 2 3 4 5 (位置) A 0.8 0.2 0.2 0.6 0.0 T 0.0 0.4 0.6 0.4 1.0 C 0.2 0.2 0.2 0.0 0.0 G 0.0 0.2 0.0 0.0 0.0 (碱基) 一条序列与特征统计图相对照,如果代价值小,说明该序列具有相应的特征,否则该序列不具备相应的特征。 * * 东南大学 吴健雄实验室 目的: 发现多个序列的共性 发现与结构和功能相关的保守序列片段 设:有k个序列s1, s2, ... ,sk,每个序列由同一个字母表中的字符组成,k大于2。 通过插入操作,使得各序列达到一样的长度。 评价多重序列比对的结果 按照每个对比的列进行打分,然后加和 处理每一列: — k个变量的打分函数 — 用一个k维数组来表示该显式函数(类似于打分矩阵) 期望: 函数在形式上应该简单 具有统一的形式 不随序列的个数而发生形式变化 其中,c1,c2,…,ck是一列中的k个字符,p是关于一对字符相似性的打分函数。 逐对加和SP(sum-of-pairs)函数 逐对计算p(1,2),p (1,3),...,p(1,8),p (2,3),p(2,4),..., p (2,8),...,p (7,8) 的所有得分 (-7-6-5-4-3-2-1)+2 = -26 另一
您可能关注的文档
最近下载
- 网络预约出租汽车企业安全生产责任制和事故报告制度.pptx
- SY-T 5051-2009 钻具稳定器-石油天然气行业标准.pdf VIP
- 22G101-3 混凝土结构施工图平面整体表示方法制图规则和构造详图(独立基础、条形基础、筏形基础、桩基础).docx
- 模板支架验收记录表.doc
- 标准个人租房合同模板.pdf VIP
- 2024年全国疾控系统大学习实验室质量控制规范答案.docx VIP
- 2024-2025学年初中道德与法治七年级(全一册)统编版(五四学制)(2024)教学设计合集.docx
- 小学劳动教育五年级下册第五单元2《维修凳子》教学设计.docx
- 北师大版五年级数学上册第五单元《分数的意义》(大单元教学设计).docx VIP
- 简易呼吸球囊.ppt
文档评论(0)