- 5
- 0
- 约 20页
- 2016-11-21 发布于湖北
- 举报
模体发现问题综述;内容概述;?;植入(l,d)模体发现问题的定义;挑战实例(Challenge Problem,2000)
在一组长度为600个氨基酸的序列组中,每条序列都包含了一个长度为15、不同位数为4的模式串,要求找出这个(15,4)模体。
该问题不适合用概率方法解决,需要用序列匹配的方法查找。;扩展植入(l,d)模体发现问题(EMP,2004)
给定t条长度为n的输入序列,其中每条序列包含长度为l的模体M的0个或多个植入(l,d)实例。要求在不知道长度l和植入实例位置的情况下,找出M。
;模体词干搜索(motif stem search,2010)
模体词干是指一个长度为l的可能包含通配符的字符串,代表了一个候选模体集。假设DNA模体为A*GT,*代表一个通配符,那么候选模体有AAGT,ATGT,AGGT,ACGT。
MSS问题就是要找到一个模体词干集合,它包含了全部可能的(l,d)模体。;植入(l,d)模体发现算法介绍(2012);并行算法介绍;A hybrid method(2012);PMSPMR??法描述
给定t条定义于字符集{A, C, G, T}上的长度为n的DNA序列,即S={s1, s2, …, st},以及长度为l字符串M和非负整数d,Bd(M)表示候选模体集,0≤d<l<n。
计算s1中所有长度为l的字串x,并将每条子串与s2到st中长度为l的字串y进行对比,若dH(x,y) ≤ 2d,则记录所有yi,最后,若Bd(M)中存在z,使得dH(z,yi) ≤ d,则yi记为模体M的实例。;PMSPMR算法描述;PMSPMR算法描述;;;;数据来源;;评价方法;模体发现问题的意义
数据划分,分割算法
算法并行化,提高运算速度
原创力文档

文档评论(0)