- 6
- 0
- 约6.74千字
- 约 72页
- 2017-06-20 发布于四川
- 举报
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 4. 隐马尔科夫模型: ProbCons 主要改进: 1. 所有序列的两两比对,通过profile HMM的方法进行双序列比对; 2. 将渐进算法与迭代算法整合; 3. 目前,性能最优。 5. 整合算法MUSCLE 算法分为三个部分,每个部分相对独立; 1. Draft progressive: (1) 对两条序列,计算距离采用k-mer的思想; (2) 用UPGMA算法构建引导树; (3) 使用渐进算法进行多序列比对; 优点:两条序列之间的距离不采用动态规划算法进行比对,节省时间。 MUSCLE 2. Improved progressive: (1)基于k-mer得到的树可能会产生次优结果,因此,采用Kimura距离的方法对k-mer产生的树重新计算距离矩阵; (2)重新用UPGMA构建进化树; (3)使用渐进算法进行多序列比对; 3. Refinement: (1)随机从进化树上挑出一条边,删除; (2)得到两组树,对每组树,计算profile; (3)将两组profile进行比对; (4)如果最终得分提高,保留结果,否则丢弃。 MUSCLE MUSCLE的算法流程 MUSCLE: 使用指南 /muscle/ MUSCLE的使用 多序列比对:性能检验 1. BAliBASE:基于蛋白质结构,将同一家族的蛋白质序列进行多序列比较。 2. 检验多序列比对工具的性能:是否能够很好的重复BAliBASE中已明确的比对结果。 AMP结合酶的结构/序列比较 性能比较 ProbCons:目前综合性能最好; T-Coffee:序列相似性高时最准确; DIALIGN: 序列相似性低时最准确; POA:性能接近T-Coffee和DIALIGN,速度最快; ClustalW/X: 最经典、被广泛接受的工具; MUSCLE: 目前最流行的多序列比对工具; 运算时间比较 * * * * * * * * * * * * * * * * * * * * * 多序列比对:最优算法 三条序列:时间复杂度:O(lmn) = O(n3) 四条序列:时间复杂度:O(n4),非多项式时间! 多项式时间复杂度要求:≤O(n3) m条序列:时间复杂度:O(nm),NPC问题! … 动态规划算法:全空间 动态规划算法:优化算法 Sequence A Sequence B Sequence C 搜索有限空间,类似于BLAST算法 动态规划算法:Hyperlattice 注意 最优的多序列比对,其两两序列之间的比对不一定最优。 最优的多序列比对 非最优的双序列比对 MSA程序 MSA - Multiple Sequence Alignment David Lipman等,1989年初始开发; 应用多维动态规划算法,得到最优的全局比对。 工具资源: /CBBresearch/Schaffer/msa.html /general/software/packages/msa/manual/manual.php MSA:打分方式 多序列比对:方法改进 1. 渐进方法:progressive methods 代表:ClustalW/X, T-Coffee 2. 迭代方法:iterative methods 代表: PRRP, DIALIGN 3. 部分有向图算法: Partial Order Algorithm (POA) 4. 全局多序列比对的隐马尔科夫模型 profile HMM 5. 整合算法: MUSCLE 1. Progressive methods (1) ClustalW/X (2) T-Coffee (1) ClustalW/X 1. Clustal: 1988年开发; 2. ClustalW: 1994年,Julie D. Thompson等人改进、发展; 3. ClustalX: 1997年,图形化软件; ClustalW/X:计算过程 1. 将所有序列两两比对,计算距离矩阵; 2. 构建邻接进化树(neighbor-joining tree)/指导树(guide tree); 3. 将距离最近的两条序列用动态规划的算法进行比对; 4. “渐进”的加上其他的序列。 两两比对,构建距离矩阵 指导树的构建 渐进比对 ClustalW的打分原则 每条序列的权值 Score:BLOSUM62的分数 ClustalX的使用 1. FASTA序列格式,多序列: ClustalX的使用——导入序列文件 执行比对 文件导出 多序列比对:结果
您可能关注的文档
- 中国古典美女图片.ppt
- 中国各个省级博物馆镇馆之宝.pptx
- 中国国际徐工数元教育.ppt
- 中国地形、气候的类型和特点及其对生产、生活的影响.ppt
- 中国城市轨道交通装备发展对策研究(铁科院).ppt
- 中国大陆知名企业家.ppt
- 中国工艺——五章秦汉.ppt
- 中国工艺美术史大作业.pptx
- 中国平安收购深发展修订.ppt
- 中国建材集团企业综合数据管理平台培训.ppt
- 2025-2026学年天津市和平区高三(上)期末数学试卷(含解析).pdf
- 2025-2026学年云南省楚雄州高三(上)期末数学试卷(含答案).pdf
- 2025-2026学年甘肃省天水市张家川实验中学高三(上)期末数学试卷(含答案).docx
- 2025-2026学年福建省厦门市松柏中学高二(上)期末数学试卷(含答案).docx
- 2025-2026学年广西钦州市高一(上)期末物理试卷(含答案).docx
- 2025-2026学年河北省邯郸市临漳县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省石家庄二十三中七年级(上)期末历史试卷(含答案).docx
- 2025-2026学年海南省五指山市九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省唐山市玉田县九年级(上)期末化学试卷(含答案).docx
- 2025-2026学年河北省邢台市市区九年级(上)期末化学试卷(含答案).docx
最近下载
- 传媒法规与伦理教学课件(共22章)新闻伦理研究综述.pdf VIP
- 汽车行驶记录仪产品使用说明书.PDF VIP
- 2026年成都市美容医疗诊所医美项目安全规范运营可行性研究报告.docx VIP
- ocean培训petrel re快速入门工作流程.pdf VIP
- (四年级奥数班讲义.doc VIP
- 单病种病案数据填报指导手册.doc
- 企业 IPO 筹备方案(最新版,附时间表 + 材料).docx VIP
- 深圳初三数学联考模拟试题.docx VIP
- 高考历史二轮总复习精品课件 第四板块 世界现代史 第十七讲 现代科技的发展与当今世界发展的趋势.ppt VIP
- 2024年菏泽职业学院单招数学考试模拟试题及答案解析.docx VIP
原创力文档

文档评论(0)