时空轨迹数据的聚类分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
时空轨迹数据的聚类分析 1 时空轨迹数据分析 在传统的gis研究中,人们通常只关注特定时间间隔内的地理区域属性和空间信息的分析。事实上,它只描述了研究对象的快照,而不具体处理连续时间数据。然而,时间、空间和属性是地理单位和地理现象本身的三个基本特征,是反映地理单位状态和发展过程的重要组成部分。随着卫星定位技术、无线通信、跟踪检测设备及视频实时采集技术的快速发展,人们能够方便地以低廉的价格获得时空轨迹数据。例如,通过传感器遥测野生动物或者鱼类的活动,通过旅行日志记录交通工具的运动状况,通过条形码的检入检出了解物流的状况,通过信用卡刷卡记录或者电话通话记录来跟踪用户的位置,甚至通过互联网搜索某对象的相关事件来确定该对象的运动轨迹等。空间对象的位置、属性都可能随着时间的推移而发生变化,人们不仅需要知道某一对象的属性和空间信息,更要了解该对象的来龙去脉,以便对其形成原因作出评估,对未来情况进行预测。时空轨迹数据恰能有效地表达时空对象的这些特性,通过分析各种不同对象的时空轨迹数据,有助于对人类行为模式、交通物流、应急疏散管理、动物习性、市场营销、计算几何以及模拟仿真等各个领域进行研究。综上所述,无论从理论、可行性还是应用的角度来看,时空轨迹数据的研究都非常必要。 为了能够从大量时空轨迹数据中发现有趣的、隐藏的、未知的知识,需要使用空间数据挖掘作为分析方法。空间数据挖掘为研究者们提供了很多有效的数据分析工具。在数据驱动的空间数据挖掘方法中,聚类分析和关联规则挖掘是两种重要的手段,其区别在于关联规则挖掘是一个异中求同的过程,而聚类分析则是同中求异的过程。通过聚类能够识别对象空间中稠密和稀疏的区域,将数据中的相似性与异常特征提取出来,从而发现全局分布模式和数据属性之间有趣的相关。这正符合人们对时空轨迹数据分析的要求,即在没有先验知识的情况下,先将数据聚合成不同的类,再对各类所代表的模式进行解读从而获得知识。 本文根据时空轨迹数据的特点,系统综述了时空轨迹聚类方法的研究进展。首先,主要阐述时空轨迹数据的定义、模型及其表达;然后,分类介绍了各种时空轨迹聚类方法的原理并对其特点进行分析和评述;最后,讨论了现有方法面临的主要问题和挑战,并展望了轨迹聚类研究的发展趋势。 2 数据不同的重要特征 时空轨迹(Trajectory)数据具有与其他数据不同的重要特征,主要体现在定义、模型和表达3个方面。它既是一种重要的时空对象数据类型,又是一种重要的信息源,因此其应用范围也非常广泛。 2.1 时空轨迹函数 时空轨迹是移动对象的位置和时间的记录序列。抽象地来看,如式(1)所示,时空轨迹是时间到空间的映射,由一个以时间为自变量的连续函数o表示的,当给定某一个时刻t(t∈R+)时,通过该函数可以得到t时刻该对象所处的d维空间Rd(一般是二维或者三维空间)中的位置。 从定义中我们可以看出,时空轨迹是连续的,但通常用一组时空记录点序列,以离散的方式表示。例如,对时空对象的实际轨迹曲线进行采样,用得到的集合来代表时空轨迹。因此,时空轨迹的模型如式(2)所示: 式中:T代表一条轨迹,序列中每一个(d+1)元组(xn1,?,xnd,tn)代表轨迹对象tn时刻在d维空间中的一个记录点,其空间位置是(xn1,?,xnd)(例如,二维空间位置通常以(xn,yn)表示,三维空间位置则通常以(xn,yn,zn)表示)。 2.3 时空轨迹数据的表达 为了对时空轨迹进行比较,常常需要通过其模型重构时空轨迹,这就是时空轨迹数据的表达。轨迹表达的方法有很多种,本节将结合Nanni对轨迹重构方法的分类方式,按照对轨迹记录点间对象运动过程的不同认识,分3部分阐述时空轨迹数据的表达。 2.3.1 时空对象的全局回归 如果时空对象的运动方式整体上服从某一规则,那么可对该对象的所有记录点进行全局回归,用关于时间t的回归方程代表时空对象的轨迹。如图1所示,黑点和白点分别代表两条不同轨迹的记录点,两条直线是采用线性回归所得到的轨迹。由于这种模型过于简化,重构的时空轨迹也不与所有采样点重合,往往不能满足实际的需要。 2.3.2 相邻记录点间的运动 有时时空对象的运动方式并非全局一致,但可以假设在相邻记录点间的局部运动是服从特定规则的,不同的规则可以用不同的局部插值方法来表达。最常见的规则是相邻记录点间对象作匀速直线运动,该规则可以用线性插值方法表达(图2a),这种模型在时空轨迹模拟和分析中均被广泛使用,并且可以采用时空路径(Space-time Path)的方式来可视化表达(图2b)。这种表达方式将二维的空间和一维的时间整合到一个三维坐标系中表示,每个记录点的x、y坐标对应记录点的空间坐标,第三维坐标则对应记录点的时间值,图中实线表示的是时空路径,虚线为时空路径在空间维上的投影。 2.3.3 信息通讯界面有

文档评论(0)

lczslgy + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档