RDF数据上的语义区域检索研究.pdfVIP

  • 16
  • 0
  • 约7.12万字
  • 约 63页
  • 2020-11-11 发布于江苏
  • 举报
RDF 数据上的语义区域检索研究 摘 要 空间 RDF 数据上的 Top k 最相关语义地点检索查询结合了基于关键词检索 和基于地点检索的两种思想。这种查询会返回一组语义地点,每个语义地点都是 以一个以带有关联位置信息的地点实体节点为根节点的子图。该查询通过计算一 个评分函数来获取语义地点和关键词之间的相关度。这个分数由每个关键词在结 果树上出现的节点和地点节点(根节点)的距离组合可得。但我们观察到由 kSP (Top k Sematic Place )算法查询返回的检索结果中,语义地点虽然在空间范围上 和查询位置接近,但是和某些关键词的相关度却比较低。我们认为这是由于单个 地点和查询词相关度较低造成的,如果可以同时返回多个相关的语义地点,或许 有助于解决这个问题。 因此,本文提出了语义地点检索的一个泛化版本,即语义区域检索。这种模 型的查询输入参数为一个查询空间范围和一组查询关键词集合,旨在返回一个在 空间上与查询位置比较接近,可以将评分函数最小化的有效语义区域,语义区域 内的每个语义地点都和一个或多个查询关键词有着较高的相关度。评分函数考虑 了区域内地点节点之间在 RDF 图上的接近程度,以及地点节点和查询关键词在 图上的接近程度。和现有的语义地点检索相比,语义区域检索返回多个与关键词 相关的地点,旨在解决单个地点无法满足用户需求的情况。 为了更好更有效地支持语义区域查询的处理过程,本文提出了一种符合分支 定界方式的算法 SRRA (Sematic Region Retrieval Algorithm )。由于计算地点关 键词相关路径,以及连接所有地点节点集合的子图的开销较大,SRRA 算法使用 了三种子集剪枝策略来处理语义区域查询。其中的一条剪枝策略通过保证一个语 义区域中的地点节点的数目不能超过查询关键词的个数,从而减少需要计算的地 点节点子集的数量。另外一个方法则是首先找到一个符合查询要求的候选语义区 域,然后通过比较这个候选语义区域和其他语义区域分数的下界,来减少需要计 算的地点节点子集的数量。在构建地点节点子集子树的过程中,算法继续使用由 候选语义区域生成的界限来提前结束某些语义区域的计算。在这些剪枝策略基础 I RDF 数据上的语义区域检索研究 上,本文还提出了两种优化技术来更加高效的处理语义区域查询。优化技术会利 用已经计算好的地点节点集合中的地点节点来判断新的地点节点是否需要被加 入,从而达到剪枝更多地点节点集合的目的。 最后,为了评估被提出的语义区域查询处理算法 SRRA 和 SRRA* (在SRRA 算法基础上结合了优化技术的算法)的具体性能,本论文在不同参数设置下设计 了多组对比实验,给出了两个算法在两份真实知识图谱数据集上的实验评估结果 并进行了分析。实验结果表明优化以后的语义区域查询处理算法 SRRA*在性能 上有着优异的表现,并且查询结果与查询词有着很高的相关度。 关键词:语义区域;空间 RDF 数据;查询处理 II Semantic Region Retrieval from Spatial RDF Data Abstract The top-k most relevant Semantic Place retrieval (kSP) query on spatial RDF data combines keyword-based and location-based retrieval. The query returns semantic places that are subgraphs rooted at a place entity with an associated location. The relevance to the query keywords of a semantic place is measured by a looseness score that aggre

文档评论(0)

1亿VIP精品文档

相关文档