dna序列完全比對搜尋系統.pptVIP

  • 0
  • 0
  • 约2.29千字
  • 约 23页
  • 2016-11-26 发布于天津
  • 举报
dna序列完全比對搜尋系統

DNA序列完全比對搜尋系統 指導教授 : 張玉盈 教授 組員: 陳政浩、林峰世、陳俊仁 背景 Human Genome Project DNA研究 未來發展 DNA序列比對之難處 一段DNA序列的長度通常有數萬至數百萬個字元數。 DNA序列沒有「字」的概念。 簡介 DNA序列,可將其視為由4個字母A,C,G,及T所組成。 演算法使用n-gram/2L來實作DNA序列的完全比對。 優點: n-gram/2L是以n-gram inverted index為基礎,做出兩層的索引架構,有效地提昇效能。 Sliding Technique Index Building Algorithm 1. Extracting 4-subsequences 2. Building the back-end index 3. Extracting 2-grams 4. Building the front-end index 建構back-end-index 建構front-end-index Query Processing Cover in Query 當我們欲查詢的字串 Q 與文件中的字串 S 欲cover時,必定符合以下條件之一: (1) Q 的字尾與 S 的字首相符 (2) Q 的字首與 S 的字尾相符 (3) Q 包含整個 S (4) S 包含整個 Q 。 Query

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档