个性化相似度匹配查询.docxVIP

  • 0
  • 0
  • 约5.56千字
  • 约 6页
  • 2023-09-05 发布于辽宁
  • 举报
随着运动目标跟踪数据的可用性不断提高,轨迹搜索和匹配变得越来越重要。提出并研究了一种新的个性化轨迹匹配问题。与传统的空间距离轨迹相似度搜索相比,PTM考虑了查询轨迹中每个样本点的重要性。PTM查询的参数为轨迹中每个样本点的用户指定的权重。它返回与查询轨迹相似度最高的参数数据集中的轨迹。我们相信这种类型的查询可能会在许多流行的应用程序中给用户带来显著的好处,比如路线规划、拼车、好友推荐、流量分析、城市计算和基于位置的服务. PTM查询处理面临两个挑战:如何在查询处理过程中削减搜索空间,以及如何有效地调度多个所谓的扩展中心。针对这些挑战,提出了一种新的两阶段搜索算法,从查询轨迹中精心选择一组展开中心,利用上下界对空间和时间域的搜索空间进行裁剪。效率研究表明,该算法在两个领域中都探索了最小搜索空间。其次,提出了一种基于优先级排序的启发式搜索策略,以调度多个扩展中心,进一步精简搜索空间,提高查询效率。在基于真实和合成轨迹数据集的大量实验中,对PTM查询的性能进行了研究. 移动设备的不断普及和GPS[31]等定位服务的迅速发展,使人们能够通过Bikely、1个GPS路径点、2个共享路径、3个和MicrosoftGeoLife4等服务来记录他们当前的地理位置和共享轨迹[32]〃越来越多的社交网站,包括Twitter,5个4平方,6个和Facebook7,支持分享轨迹。大量轨迹数据的可用性使新的移动应用成为可能。这类应用程序可以利用轨迹搜索和匹配,找到与查询输入(通常是轨迹)在某种特定意义上相似的轨迹。这种类型的查询可以使许多服务受益,包括路线规划、拼车、好友推荐、交通分析、城市计算和基于位置的服务。例如,游客可以查看其他游客的旅游历史,提高自己的旅游水平;通勤者可以找到拼车的伙伴;基于位置的社交网络可以识别出拥有相似旅游路线的用户,并将他们推荐为朋友. 在现有的大多数研究(如[1,6,7,11,17,18,30])中,查询只在空间上进行指定,这意味着轨迹匹配只考虑空间相似性。然而,在实际应用场景中,例如在推荐系统中,由于用户的特殊偏好,空间相似性不足以评估两个不同轨迹之间的关系。在给定查询轨迹q的情况下,现有的研究对每个样本点oq都一视同仁,无论是加油站、换乘中心还是观光景点。因此,旅游服务可能会向游客推荐错过预定观光地点的旅行路线,或者服务可能会向通勤者推荐不合适的拼车伙伴(例如,其旅行路线不经过预定地点)。虽然建议的轨迹可能在空间上与查询轨迹相似,但用户可能对建议不完全满意,因为他们的关键偏好没有得到满足. 考虑到现有轨迹匹配方法的不足,提出并研究了一种新的轨迹匹配问题一一个性化轨迹匹配(PTM)。的传统轨迹搜索基于空间相似性只(例如,[1、6、7、11、1718日,29日,30日]),多功能天车的查询也考虑每个样本点的意义o在查询轨迹q。最初,系统可能分配一个默认重量每个样本点阿q来描述它的重要性;用户可以根据自己的喜好调整权重。例如,当游客搜索旅游路线或通勤者寻找拼车机会时,一些地方(如观光地点、换乘中心)的权重应该高于其他抽样点。据我们所知,这是第一次在考虑轨迹样本点重要性的情况下,在空间网络中研究更一般的轨迹匹配问题。先前的研究假设轨迹长度相等(即,为相同数量的样本点),并为每个样本点分配相同的显著性。相比之下,我们将每条轨迹视为任意长度的加权样本点序列。 一个例子是显示在图1中,T1在哪里查询轨迹(q=T1),而T2和T3轨迹数据集T。在查询时,系统分配一个默认每个样本点OT1重量。此外,01、o2、o3和04是用户指定的预期位置,它们的权重被设置为高于默认权重的值。在查询处理中,如果只考虑空间相似,轨迹T3将返回,因为它是越来越比T2更类似于查询。但是,用户不太可能满意这个结果因为T3只包含一个预定的地方,而不是接近他人。我们的方法考虑了每个样本点的意义OT1T2是更好的查询轨迹T1候选人。尽管T2不如T3根据空间相似,它通过或接近所有的地方。 提出的PTM查询应用于空间网络,因为在大量的实际场景中,对象在这样的网络(例如,公路、铁路、河流)中移动,而不是在欧几里德空间中。轨迹是运动物体的时间戳采样点序列。我们假设所有样本点已经对齐的顶点对应的空间网络(空间域)据匹配方法(例如,[2、3、14、20、28]),a和b两个相邻采样点之间,一个移动的物体总是遵循最短路径连接的a和b。所有轨迹采样点的时间戳被映射到时间轴的范围内24小时(时间域)。一个直接解决PTM问题的方法叫做平衡搜索。在查询时,每个样例点oq都被认为是查询源(扩展中心)。在空间域和时间域同时进行平衡搜索,在这两个域中请求与查询轨迹q相似的轨迹。结合这两个域的搜索结果,可以得到与q相似度最高的轨迹。平衡搜索的主要缺点是搜索空间重叠。给定两个相邻的采样点(通常彼

文档评论(0)

1亿VIP精品文档

相关文档