半構造化テキストに対する文字列照合アルゴリズム.pptVIP

  • 3
  • 0
  • 约 16页
  • 2016-11-24 发布于天津
  • 举报

半構造化テキストに対する文字列照合アルゴリズム.ppt

半構造化テキストに対する文字列照合アルゴリズム.ppt

情報処理学会九州支部 若手の会セミナー 2002 文字列照合を用いた XMLデータアクセス機構の提案 喜田 拓也* 宮本 哲? 竹田 正幸? *九州大学附属図書館研究開発室 ?九州大学システム情報科学府情報理学専攻 発表内容 研究の目的 既存の手法 我々のアプローチ 文字列照合による処理の利点と問題点 提案アルゴリズム 誤検出を回避する方法 パスを考慮した照合処理 実験結果 XPathのサブセット まとめ 既存の手法 我々のアプローチ 利点 巨大なXML文書や大量の文書群を一括に処理 複数の質問を同時に処理 文字列照合問題 Aho-Corasick(AC)照合機械 問題点 タグ名の一部分とマッチする 解決策 PMM構築方法 パスを考慮した照合 アイデア 実験結果 Sgrep(J. Jaakkola and P. Kilpel?inen)との比較 処理可能なXPathのサブセット 文字列照合による手法の限界 先行ノードの指定はできない! 複雑なフィルタの指定は照合速度を著しく低下させる。 まとめ XML文書に対する文字列照合処理 誤検出しない効率的な照合機械の構築 パスを考慮したアルゴリズム Sgrepに比べ3倍以上高速 処理可能なXPathのサブセットを定義 今後の課題 XPathのサブセットに対する実装 XML文書を圧縮して処理を高速化 属性の取り扱い * * 発表者: 喜田

文档评论(0)

1亿VIP精品文档

相关文档