長さの制限付きギャップと文字クラスを含むパタンに対する..ppt

長さの制限付きギャップと文字クラスを含むパタンに対する..ppt

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
長さの制限付きギャップと 文字クラスを含むパタンに対する 照合アルゴリズムの改善 九州大学附属図書館 喜 田 拓 也 長さの制限付きギャップと文字クラス PROSITEパタン タンパク質検索で用いられるパタン 例: C-x(2,4)-C-x(3)-[LIVMFYWC]-x(8)-H-x(3,5)-H 長さの制限付きギャップ a以上、b以下のギャップ x(a, b), x(a)=x(a, a) 文字クラス(文字種) 文字の集合 [abc…] これまでの手法 文字クラスに対する文字列照合アルゴリズム Shift-And法 (Abrahamson 1987, Wu-Manber 1992) → O(m|?| + ?m/w? n) 正規表現パタンに対する文字列照合 DFAへ変換 → O(2m+n) 時間 NFAへ変換 → O(m×n) 時間 PROSITEパタンに対する文字列照合アルゴリズム Gaps-Shift-And法 (Navarro and Raffinot 2001) → O( ?Pmax/w?×n) 文字クラスを含んだパタン照合 Shift-And法のアイデア パタン a-a-b-a-[bc] を検出するNFA Shift-And法の動作 ギャップ付きShift-And法のアイデア パタン a-b-[cd]-x(1,3)-e-f を検出するNFA Gaps-Shift-And法における NFAの状態遷移の模倣 Shift-And法の状態更新 D ? ((D 1) | 0m?1) B[ tj ] ?遷移の模倣 D ?D | (( F ? ( D I )) ?F ) Gaps-Shift-And法改良のアイデア 5 の状態に注目! カウンタ Clk 整数 k?1 を2進数で表現したビット列を反転したビット列で長さが l のものを Clk とする。 LongGaps-Shift-And法の計算 Shift-And法の状態更新 D’ ? ((D 1) | 0m?1) B[ tj ] 新たにアクティブになったギャップ開始地点の検出 A ? ( F ? ( D’ I )) ?F ) カウンタのリセット C A (ここで C はカウンタの初期ビット列) インクリメントされるカウンタの検出 Dc ? (G ? A) D (G はカウンタの位置をマスクするビット列) カウンタのインクリメント ( Dc + (( Dc (lmax ? 1)) I )) G 状態更新の式 D ? D’ ?G | C A | (Dc + (( Dc (lmax ? 1)) I )) G LongGaps-Shift-And法と Gaps-Shift-And法との要ビット数の比較 まとめ NavarroとRaffinot[2001]が提案したGaps-Shift-And法を基に、長いギャップでも少ないビット列で計算可能なLongGaps-Shift-And法を開発した 実装?実験はこれから ???たぶん、遅い???(演算回数が2倍以上!) ギャップの下限a が上限b に近いと効果がない PROSITEパタンはギャップが短いのがほとんど (ToT) * * 0 1 2 3 4 5 ? b a a b a c aababcaabacab テキスト:= 1 0 0 0 0 aababcaabacab abc パターン:= a b a [bc] a テキスト:= a-a-b-a-[bc] 1 1 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 1 1 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 1 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 1 1 0 1 0 1 0 0 1 0 ビット列 B D ? ((D 1) | 0m?1) B[ tj ] 0 1 2 4 8 ? c a b e d 7 5 3 6 f ? ? ? ? ? a = 1 b = 3 b?a = 2 0 1 2 4 8 ? c a b e d 7 5 3 6 f ? ? ? ? ? F:I:F? I:0 1 2 4 8 ? c a b e d 7 5 3 6 f ? ? ? ? ? D:0001110000000100 C85 = ? ( 0 0 0 0 0 1 0 1) = 1 1 1 1 1 0 1 0 1 1

文档评论(0)

勤劳的小厮 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档