面向轨迹数据的函数连接及相似性查询算法研究-计算机科学与技术专业毕业论文.docxVIP

  • 5
  • 0
  • 约4.59万字
  • 约 62页
  • 2019-05-11 发布于上海
  • 举报

面向轨迹数据的函数连接及相似性查询算法研究-计算机科学与技术专业毕业论文.docx

万方数据 万方数据 Classified Index: TP315 U.D.C: 004.4 Dissertation for the Master Degree in Engineering TRAJECTORY DATA ORIENTED FUNCTION JOIN AND SIMILARITY SEARCH ALGORITHM Candidate: Zhang Guannan Supervisor: Zhang Wei Academic Degree Applied for: Master of Engineering Speciality: Computer Science and Technology Affiliation: School of Computer Science and Technology Date of Defence: July, 2014 Degree-Conferring-Institution: Harbin Institute of Technology 哈尔滨工业大学工学硕士学位论文 哈尔滨工业大学工学硕士学位论文 摘 要 当今时代,信息化特征明显,人们观察物理世界所获得的数据均用计算机 信息表示。为了更好的观察和分析人们生活的物理世界,人们采用了多种多样 的信息数据收集方法。而如何能够将这些数据融合,如何检索到相似的数据已 成为研究的热点。本文主要分成两大部分,第一部分是讲述如何采用函数连接 算法解决传统方法解决不了的目标轨迹数据与属性值数据的关联问题;第二部 分是讲述如何在给定的目标轨迹下,查询相似的轨迹数据。 在面向轨迹数据的函数连接算法中,本文先给出了目标轨迹数据和属性值 数据的数据模型的定义,这些定义反映了关系数据库中的数据的存在方式。继 而本文给出了循环函数连接算法,这种算法使用循环的方法,对任意一条轨迹 和属性值数据进行判断,看是否满足连接条件。在这里判断的条件采用的是函 数的方法,本文利用轨迹数据和属性值数据作为函数的输入条件,函数通过数 据是否存在相近的时间空间关系和属性值数据是否满足属性值限制条件来判断 是否满足条件。当满足条件时,连接成功。之后本文提出了一种基于哈希的算 法来改进原有的循环连接算法。基于哈希的函数连接算法能够有效的解决循环 算法的缺点,即不能在大规模的数据下使用。在这两种算法基础上,我们又给 出了一种优化的策略,这种优化是将目标轨迹的数据进行压缩,从而减少连接 操作的运算量。对于这种优化策略,我们给出了相应的理论分析,并给出了误 差率。 在面向轨迹数据的相似性查询算法中,本文先给出了新颖的目标轨迹的距 离函数度量的方法。这种方法有效的解决了目标轨迹之间相似度的计算,并为 后文提出的算法奠定了基础。接下来本文给出了相似性的定义和判断,在本文 当中,我们采用欧式空间的距离函数来判断是否两个目标轨迹数据相似。之后 本文给出了一种判断相似性的算法,即利用给定的轨迹数据,截取轨迹的子串 并和数据库中的轨迹数据做相似性判断的算法。通过这种算法我们能够查询相 似的轨迹数据。最后我们给出了面向轨迹数据的相似性查询算法的改进策略, 给出了改进算法的召回率,并同时给出了对比实验。 关键词:函数连接;目标轨迹;相似性查询;密度查询 I - Abstract Nowadays, the features of information are more explicitly. All the Data got by people is stored in database using computer binary information. In order to observe and analyze people’s lives in the physical world better, we use a variety of information and data collection methods. How to do fusion operation to these data and how to retrieve similar data has become a hot research field. This paper is divided into two parts. The first part is about how to use the function join to improve the traditional method which cannot solve the problem that target trajectory data associated with the attribute value data.

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档