基于哈希技术的时间序列近似查询研究-计算机应用技术专业论文.docxVIP

基于哈希技术的时间序列近似查询研究-计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于哈希技术的时间序列近似查询研究-计算机应用技术专业论文

万方数据 万方数据 独 创 性 声 明 本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得 宁波大学或其他教育机构的学位或证书所使用过的材料。与我一同工作 的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了 谢意。 若有不实之处,本人愿意承担相关法律责任。 签名: 日期: 关于论文使用授权的声明 本人完全了解宁波大学有关保留、使用学位论文的规定,即:学校 有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论 文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。 (保密的论文在解密后应遵循此规定) 签名: 导师签名: 日期: 宁波大学硕士学位论文 基于哈希技术的时间序列近似查询研究 摘 要 近 年 来 , 随 着 互 联 网 的 快 速 发 展 , 随 时 随 刻 产 生 着 不 计 其 数 的 信 息 。 在 数 据 挖 掘 、 机 器 学 习 、 信 息 检 索 等 领 域 , 如 何 从 庞 大 的 信 息 中 , 挖 掘 有 用 的 信 息 显 得 尤 为 重 要 。 这 些 信 息 包 含 多 种 数 据 , 其 中 有 一 种 是 与 时 间 有 关 的 数 据 , 即 时间 序列。 时间序 列广泛 存在于 各个领 域中, 如金融 、地理 、医学 和气象 等。 目 前 时 间 序 列 数 据 研 究 主 要 集 中 在 时 间 序 列 的 相 似 性 查 询 、 时 间 序 列 的 聚 类 /分 类 分 析 、 时 间 序 列 的 可 视 化 研 究 、 时 间 序 列 的 分 段 、 时 间 序 列 的 趋 势 预 测 和异 常检测 等。 时 间 序 列 相 似 性 问 题 是 时 间 序 列 挖 掘 中 一 个 基 础 问 题 , 自 被 提 出 以 来 一 直 备 受 关 注 。 所 以 选 择 时 间 序 列 相 似 性 查 询 作 为 研 究 很 有 意 义 。 由 于 时 序 数 据 的 数 值 性 和 连 续 性 , 一 般 考 虑 的 是 时 间 序 列 的 整 体 而 不 是 单 个 数 值 。 所 以 与 传 统 数 据 库 的 相 似 性 查 询 不 同 , 时 间 序 列 数 据 的 相 似 性 查 询 一 般 以 近 似 的 方 式 进 行。 由 于 时 间 序 列 的 高 维 性 , 很 难 直 接 对 它 进 行 处 理 。 而 哈 希 技 术 是 一 种 很 常 用 的 压 缩 映 射 技 术 , 它 可 以 通 过 散 列 算 法 把 任 意 长 度 的 输 入 转 换 成 固 定 长 度 的 输 出 。 该 输 出 值 的 空 间 通 常 远 小 于 输 入 的 空 间 , 因 此 可 以 使 用 哈 希 技 术 来 处 理 时间 序列。 本文 的主要 研究内 容包括 以下几 个方面 : 首 先 提 出 一 种 利 用 LSH( Locality Sensitive Hashing, 局 部 敏 感 哈 希 ) 算 法 处 理 时 间 子 序 列 匹 配 问 题 的 方 法 LSHSM。 LSH 能 够 将 距 离 近 的 对 象 以 很 高 的 概 率 哈 希 到 同 一 个 桶 中 , 通 过 这 样 的 处 理 , 可 以 过 滤 很 多 不 相 似 的 对 象 , 避 免 不 必 要 的 比较 , 从 而大 大 提 高检 索 速 度。 不 同 于 FRM 和 DualMatch 方 法, 本 文 方法 不 需 要 对 时 间 序 列 做 DFT、 DWT 等 特 征 变 换 , 而 是 直 接 把 序 列 当 成 高 维 数 据 点 , 利 用 LSH 能 处 理 高 维 数 据 的 特 性 来 查 找 时 间 子 序 列 。 实 验 采 用 三 种 不 同 的 时 间 序 列数 据集, 验证了 算法的 有效性 。 然 后 通 过 引 入 关 联 删 除 的 概 念 , 来 处 理 两 个 属 性 的 时 间 序 列 。 若 要 根 据 时 间 序 列 的 一 个 属 性 删 除 另 一 个 属 性 , 为 了 保 持 时 间 序 列 数 据 的 一 致 性 , 需 要 存 储 两 个 属 性 的 关 联 信 息 。 布 鲁 姆 过 滤 器 是 一 种 很 强 大 的 表 示 数 据 概 要 的 工 具 。 利 用 它 们 来 分 别 表 示 时 间 序 列 数 据 两 个 属 性 的 概 要 , 实 现 对 过 期 数 据 的 删 除 操 I 基于哈希技术的时间序列近似查询研究 作

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档