高维数据索引结构研究计算机应用技术专业论文.docxVIP

高维数据索引结构研究计算机应用技术专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高维数据索引结构研究计算机应用技术专业论文

复旦大学博士毕业论文;膏ll敦撰索引结构研究 复旦大学博士毕业论文;膏ll敦撰索引结构研究 董道田 摘 要 随着互联网和多媒体技术的迅速发展,人们可以访问到的多媒体数据急剧增 长,如何实现多媒体数据对象的相似检索成为一个非常重要的研究课题。通常, 人们利用特征提取算法从多媒体数据对象中提取出特征矢量,然后利用特征矢量 之间距离表示多媒体对象之间相似度。相似性检索的实现就是通过计算查询矢量 与数据库中矢量之间距离以找出满足条件的对象。当数据库中矢量很多时,简单 的顺序扫描搜索将导致极大查询代价,无法满足用户需求。为了有效实现快速相 似性检索,就必须借助于高效的高维数据索引结构。 在最近几十年中,人们提出了很多高维数据索引结构,其中大多是树形结构, 如R-Tree、R·-Tree等,这些索引结构在维数升高时性能会急剧下降,即所谓的 “维数灾难”,为此,有人提出了通过近似压缩矢量来减少磁盘I/O代价的 VA-File,但仍不能为高维数据的相似性检索提供良好的查询性能。针对高维数 据索引结构的现状,我们在该领域进行了深入研究,取得了一定的成果。 首先,我们提出了四种新的索引结构:1)Angle-Tree:用高维空间中单位超 球面上的超弧对空问进行划分,并借助于树形结构实现索引,可有效支持以矢量 之间夹角余弦为相似度度量的查询方式;2)VAR-Trce:将ⅥkFile与R-Trec有 机结合起来,用R-Tree来管理和组织近似矢量数据,并借助R.Tree类相似查询 算法实现基于、强R.Tbe的查询:3)VA-Trie:利用Tile结构来索引、,A.File中 近似矢量,有效实现了高维数据的相似性检索;4)oⅥ^.Fjlc:将VA-Ffle中近 似矢量插入到近似文件中合适位置,使得在高维空问中相邻数据尽量存放在近似 文件的相近位置上,从而在查询过程中仅访问部分近似矢量,就可快速得到质量 很高的相似查询结果。 其次,在高维数据索引结构研究基础上,本文分别给出了基于VA-FIlc和 OVA-File的、以高维矢量序列为查询对象的视频片断相似查询方法,以有效利 用高维索引结构同时支持视频信息检索中的镜头检索和视频片断检索。 最后,结合一个实际的多媒体信息检索系统,进一步阐述高维索引结构在实 际系统中的应用。我们利用OVA-FIle管理来自于海量视频数据的高维矢量,基 于镜头和视频片断相似查询模型实现了视频数据的快速相似性检索。 关键字:信息检索、索引结构、相似查询、多媒体数据库 中图分类号:TP311.1 复旦大学博士毕业论文·高赡t据囊弓l结构研究 复旦大学博士毕业论文·高赡t据囊弓l结构研究 董道墨 Today,molc and more multimedia information sourccs are available in digital form due to the development of Computer and Internet.m issue to speed up the similiarity query of multimedia objed becomes much important.Mostly,similarity call not be measured on the multimedia objects directly,but rather,On abstractions of objects termed feature vectors.the distances of which arc used to represent the similarity.The brute force approach for similarity query is to sequentially scao all the feature vectors.In typical multimedia applications,databases usually contain a large number of feature VeCtors,and sequential scan will incur extremely high disk FO cost. Many index structures have been proposed to solve this difficult problem,such as R-Tree and its variants,VA-File,Pyramid-Technique etc..From the published results,it can be concluded that most of these methods could achieve goo

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档