不确定图数据tp-k查询算法研究.pdfVIP

  • 9
  • 0
  • 约 56页
  • 2016-01-12 发布于四川
  • 举报
不确定图数据tp-k查询算法研究

摘 要 近年来,图数据模型广泛应用于生物信息、计算化学、语义网等领域。现有的图数据查 询处理技术大多基于频繁子图,是一个过滤、验证过程,即首先通过挖掘出来的频繁子图构 造索引,然后根据索引产生侯选集,最后对侯选集中的每一个图进行子图同构验证,最终获 取结果集。在这类算法中,索引构造时的参数选择策略影响查询图侯选集的大小,同时验证 阶段需要对每一个侯选图进行子图同构测试,没有利用图之间的差异性。 本文针对确定图的子图同构查询,定义了图数据相似度,根据相似度构造索引,进行图 数据的查询处理。相似度基于图之间的子图映射关系,是两个图之间最大公共子图的集合。 相似度索引基于倒排索引,通过计算任意图与其它图之间的相似度构造成相似度集合。与基 于频繁子图索引的查询流程不同,基于相似度索引的图数据查询处理是一个迭代收敛过程, 首先从数据库中按照对查询图的搜索空间大小选择一个侯选图,然后计算查询图与侯选图的 最大匹配图,如果候选图包含查询图,则根据相似度索引输出查询结果集;否则,根据最大 匹配图过滤图数据库并重复以上过程。 本文针对不确定图数据ToP—K包含查询问题,将概率上界信息集成到确定图数据库频繁 子图索引和相似度索引中,提出了不确定图数据库索引结构。通过比较概率上界与中间结果 集优先队列中的概率值,减少子图匹配计算次数,提高ToP—K查

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档