2014夏令营B教程详解.ppt

3.2.4 Overlap有向图建立算法分析 1) Overlap有向图建立 当子串越长,两个reads片段重复的概率越小,算法执行越快,但会使许多reads无法连接到一起。 另一方面,若越小,两个reads片段连接的概率越大,算法执行越慢,同时错连概率增大。 因此,将Overlap图的建立分为两步,先取子串长为30建立Overlap图,之后对无后继节点取子串长为10,完善Overlap图。 2) Overlap有向图建立结果 Matlab编程得到最后的44042×2的矩阵,第行第1列表示片段的后继片段,第2列表示与的最大重复度。 3.3 Contigs的建立 3.3.1分析: 基于 reads 之间的 overlap 有向图,拼接获得的序列称为 Contigs(重叠群),Contigs的建立是连接成更长碱基链的过渡环节。 3.3.2 模型建立 先列举10个片段进行说明,假设这10个片段建立了如下的Overlap图,第二列表示两个片段的最大重复度。 Overlap图说明:1的后继片段是7,7的后继片段是10,10没有后继片段。所以得出Contigs如下单链;2的后继片段是3,4的后继片段也是3,3的后继片段是5,5没有后继片段,所以得出Contigs如下分叉;6的后继片段是8,8的后继片段是9,9的后继片段是8,

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档