基于迭代网格划分和熵估计的稀疏轨迹预测.docVIP

下载本文档

2
0
约1.04万字
约 15页
2016-09-04 发布于北京
举报
版权申诉

基于迭代网格划分和熵估计的稀疏轨迹预测.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于迭代网格划分和熵估计的稀疏轨迹预测.doc

基于迭代网格划分和熵估计的稀疏轨迹预测　　摘要：针对移动对象轨迹预测所面临的“数据稀疏”问题，即有效的历史轨迹空间不能覆盖所有可能的查询轨迹，提出了一种基于迭代网格划分和熵估计的稀疏轨迹预测算法（TPDSIGPEE）。首先，对轨迹区域进行迭代网格划分并生成轨迹序列；然后，引入LZ熵估计计算轨迹序列的熵值，在轨迹熵值的基础上进行轨迹综合形成新的轨迹空间；最后，结合子轨迹综合算法，进行稀疏轨迹预测。实验结果表明，当轨迹完整度达到90%以上，Baseline算法的查询覆盖率只有25%左右；而TPDSIGPEE算法几乎不受查询轨迹长度的影响，可以预测几乎100%的查询轨迹；并且TPDSIGPEE算法的预测准确率普遍高于Baseline算法4%左右；同时Baseline算法的预测时间非常长，达到100ms，而TPDSIGPEE算法的预测时间（10μs）几乎可以忽略不计。TPDSIGPEE算法能够有效地进行稀疏环境下的轨迹预测，具有更广的预测范围、更快的预测速度和较高的预测准确率。　　关键词：轨迹预测；数据稀疏；迭代网格划分；LZ熵估计；子轨迹综合　　中图分类号： TP312 　　文献标志码：A 　　0引言　　随着智能手机和和车载导航系统的广泛使用，它们已经成为人们日常生活中不可或缺的一部分，人们也越来越多地受益于路径推荐、基于位置的社交网络等不同的基于位置的服务（Location Based Service， LBS）。当前，新兴的基于位置的应用都要求轨迹预测，例如，推荐旅游景点、基于目的地的广告投放和自动设定导航目的地。因此，轨迹预测技术已经成为基于移动位置信息的研究和应用热点问题之一。　　大量研究证明人类的移动性具有很高的可预测性[1-2]。常用的轨迹预测方法使用来自于轨迹共享网站的历史空间轨迹[3]和大型出租车轨迹集合[4]。Ashbrook等[5]通过估计位置目的和分析用户移动模式来进行轨迹预测；刘震等[6]提出Match算法对基于移动通信数据的用户移动轨迹进行预测；彭曲等[7]采用马尔可夫链对所有轨迹建立有向图，通过统计和计算得到k步转移概率矩阵用于轨迹预测。但是以上轨迹预测方法都是在历史轨迹空间的基础上进行轨迹预测，并没有考虑到“数据稀疏”问题：历史轨迹中没有预测轨迹的“匹配”轨迹，很难满足现实生活中轨迹预测的需要。　　针对轨迹预测中的数据稀疏问题，文献[8-9]提出一种基于子轨迹综合（SubTrajectory Synthesis， SubSyn）算法的轨迹预测方法，将历史轨迹序列化并划分为只包含相邻两个点的子轨迹，连接子轨迹形成“综合”轨迹。但该方法仍存在着不足：使用均匀网格划分，导致轨迹序列化的结果偏离原始轨迹；历史轨迹空间过大，存在异常轨迹，会影响“综合”轨迹的可信度，从而降低预测准确性。针对上述不足，对文献[8]的方法进行改进，提出基于迭代网格划分和熵估计的稀疏轨迹预测方法，首先对轨迹空间进行迭代网格划分并生成轨迹序列；然后引进轨迹熵值来评价轨迹的规律性，选择规律性较强（即熵值较低）的轨迹作为历史轨迹空间；并在此基础上，划分交叉轨迹形成子轨迹，通过基于熵值的轨迹综合得到规律性更强的轨迹空间用于轨迹预测。　　1迭代网格划分和轨迹序列生成　　对于移动对象运动空间划分最简单的方法是使用固定尺度的均匀网格覆盖样本空间。其实，当人们在网络上浏览地图时，从不同的尺度上看到地图的效果是不一样的。同样大小的范围，不同尺度下地图所能包含地理元素的量不一样，这个现象主要是地图精度不同造成，地图上同样大小的矩形区域中包含的地理元素越少，精度越高，图像上所表示的地理元素越精确；反之亦然。同理，对于固定大小的样本空间，如果对样本空间划分越细致，那么在此基础上得到的序列化轨迹结果越接近于原始轨迹。使用同一尺度的均匀网格划分运动空间，容易将密切联系的数据点按照网格划分分离到不同网格中，造成数据类的分裂，产生误差。如图1所示的四个数据点从空间位置上来看联系非常紧密，由于均匀网格划分，这些点被分配到不同网格中，样本点之间的联系被割裂开，这可能对挖掘结果产生巨大影响。　　1.1迭代网格划分　　针对上述问题，提出空间迭代网格划分方法（Spatial Iterative Grid Partition， SIGP）。对于高密度样本区域迭代地进行多层次划分，每深入一个层次的划分都使覆盖网格的精度提高一倍。由于SIGP对样本点高密度区域进行不断细分，最终使得覆盖高密度区域的网格单元格尺寸能取到一个合适值，如图2。　　z输入：历史轨迹全球定位系统（Global Positioning System， GPS）数据点集合D；划分初始参数d；每个单元格内轨迹点个数阈值n；　　输出：迭代划分的网格G。