时空同现挖掘算法及应用研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
时空同现挖掘算法及应用研究.doc

时空同现挖掘算法及应用研究   摘 要: 在隐藏于历史轨迹数据集的众多模式中,同现模式的挖掘尤其引人关注。文章将时空同现的数据挖掘算法与Hadoop平台相结合,实现了并行处理,对轨迹数据进行预处理,并设计了时空同现模式挖掘算法。实验结果表明,该算法能够挖掘乘客集中地,为出租车司机提供合理有效的载客路径。   关键词: 时空同现; 并行处理; 出租车轨迹数据; 数据挖掘   中图分类号:TP311 文献标志码:A 文章编号:1006-8228(2016)11-05-02   Spatiotemporal co-occurrence mining algorithm and the application   Zhang Yi1, Zhang Yongmei2, Guo Sha2, Jiang Ailian3, Wu Xiaoyan2   (1. College of Software, Taiyuan University of Technology, Shanxi, Taiyuan 030600, China; 2. College of Computer, North China University of Technology; 3. College of Computer Science and Technology, Taiyuan University of Technology)   Abstract: Among the many modes hidden in the historical trajectory data set, mining the co-occurrence modes is particularly concerned. In this paper, combining the spatiotemporal co-occurrence data mining algorithm with Hadoop platform, the parallel processing is realized to pre-process the trajectory data, and the spatiotemporal co-occurrence mining algorithm is designed. The experiment results show that the algorithm can mining concentrated areas of passengers, and provide reasonable and effective paths for taxi drivers.   Key words: spatiotemporal co-occurrence; parallel processing; taxi trajectory data; data mining   0 引言   时空同现模式就是在时空维度下,不同对象类型子集的实例在一些时间段内,在空间上是相互邻近的,或符合某种空间关系的对象集合。在许多应用领域如:环境监测、抢险救灾、基于位置的服务等,数据都随着时间变化而变化。然而,大多数数据库都不能有效地处理数据的时间维度。当数据发生变化时,无法对数据变化的趋势进行分析,更无法预测未来的趋势。因此,从这些大量的数据中挖掘出有价值的信息变得更加重要,时空同现模式挖掘成为研究热点。   随着移动电话、GPS(Global Positioning System,全球定位系统)等具备定位功能的设备普及,产生了大量基于时间和空间的移动对象历史轨迹数据。在地理信息系统中,移动对象的历史位置信息日益重要,在这一背景下,针对移动对象历史轨迹的数据挖掘研究成为当前研究热点之一[1-2]。与传统事务性数据集相比,从空间数据集中识别感兴趣的模式更为困难和复杂,因为空间数据集具有复杂的数据类型和关系,而且数据总量庞大。在隐藏于历史轨迹数据集的众多模式中,同现模式的挖掘尤其引人关注。空间数据集的同现模式直观地反映了移动过程中移动对象之间相互接触的情况,所以快速准确地挖掘时空数据中的同现模式有利于推动众多领域的研究,如生态、电力系统故障分析、军事等。   虽然时空同现模式挖掘已经取得了一些令人欣慰的研究成果,但总体来说还处于起步阶段。随着空间数据采集效率的提高,空间数据逐渐增大。在时空同现模式挖掘研究领域中,MeteCelik等人提出的混合驱动的时空同现模式挖掘最具有代表性。为了挖掘时空同现模式,他们提出了混合时空同现模式挖掘算法。该挖掘算法是基于连接操作的,会消耗大量时间生成候选模式集,随着对象类型的增多,需要生成的候选模式集数量呈指数级增长,这意味着需

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档