基于内容的视频检索关键技术的分析-通信与信息系统专业论文.docxVIP

基于内容的视频检索关键技术的分析-通信与信息系统专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 10 第一章 绪 论 1.1 问题的提出 随着科学技术的发展,特别是多媒体技术的迅速发展, 信息高速公路的建 设,现代信息处理的对象和方法都有了很大的变化。近年来,比较显著的特点就 是各种类型的信息在全球得到了广泛的应用,人们已经进入一个信息化的社会。 而图像、视频等多媒体数据已逐渐成为信息处理领域中主要的信息媒体形式。如 何对这些海量无序的视频信息进行检索,传统的信息检索技术遇到了很大的问 题,于是基于内容的多媒体信息检索技术应运而生。 早期的多媒体检索方案主要借用了基于文本数据库的检索方法。具体来说, 就是用手工的方法或者借助计算机等工具给视频添加一些文字描述或数字标签, 在需要检索时,通过查询标签或者关键词来寻找所需要的视频信息。关键词一般 采用人工方式编写,带有很大主观性,不同的人或同一个人在不同条件下对同一 组视频可能会给出不同的描述。而且手工标注的工作量极大,很难对所有视频数 据都进行这样的手工标注处理。因此,传统的检索方法已不能满足现代检索的需 要。所以如何对视频信息进行检索以及实现视频信息的共享成了人们期待解决的 一项课题。目前,基于内容的视频检索工作主要集中在识别和描述图像的颜色、 纹理、形状、空间关系的基础上,对视频数据进行镜头边界检测、关键帧提取、 图像检索等方面。因此这是一门涉及面很广的交叉学科,需要利用图像处理、模 式识别、计算机视觉、图像理解等领域的知识作为基础,还需从认知科学、人工 智能、数据库管理系统、人机交互、信息检索等领域引入新的媒体数据表示和数 据模型,从而设计出有效的检索算法、系统结构以及友好的人机界面。基于内容 的视频检索具有如下特点[1]: (1)突破了传统的基于表达式检索的局限,直接对视频信息进行分析,提 取特征,利用这些特征建立索引进行检索。 (2)提取特征方法多种多样。图像特征如颜色、纹理、形状轮廓、位置、 空间关系等。 (3)基于内容的视频检索是一种近似匹配。在检索的过程中,它采用相似 西北师范大硕士学士学位论文第一章 西北师范大硕士学士学位论文 第一章 绪论 性匹配的方法逐步求精来获得查询的结果。即查询是一个迭代过程,不断减小查 询结果的范围,直到定位到目标。这一点与常规数据库检索的精确匹配方法有明 显不同。 (4)大型数据库的快速检索。在实际的多媒体数据库中,数据量巨大,种 类繁多,因此要求 CBVR 技术也能象常规的信息检索技术一样,快速地实现对视 频信息的检索。 1.2 国内外的研究现状 自从提出基于内容的视频检索概念以来,国内外许多大学、科研单位等都开 始投入大量的人力、物力和财力开始研究,从而使该领域迅速成为一个非常活跃 的热点议题,在国际上每年召开的有关多媒体技术的学术大会中,有许多重要的 系列大会都开辟了基于内容的视频检索主题和分会,而 IEEE 和 SPIE 都组织了 专门的基于内容的多媒体信息检索会议。这些都极大地推动了基于内容的视频检 索的发展。目前,国内外已研发出了多个基于内容的视频检索系统: (1)QBIC QBIC全称是Query By Image Content,是IBM Almaden研究中心开发的基于 内容的检索系统,它是第一个功能齐全的视频数据库系统,也是基于内容检索系 统的典型代表,对视频数据库发展有较深远的影响[2]。QBIC结合了多种查询方 式,如标准的系统查询方式,选择特征查询和草图查询等,因此它的用户交互性 比较好。 (2)VisualSeek 美国哥伦比亚大学电子工程系与电信研究中心图像和高级电视实验室共同 研究的VisualSeek是一种在互联网上使用的基于内容的检索系统[3]。VisualSeek同 QBIC一样提供了多种查询方法:根据视觉特征、图像注释、草图等。它根据草 图检索的方法注重图像中不同色块的空间位置关系,只有具有良好空间区别性的 草图才可以得到较好的结果。它实现了互联网上的基于内容的图像/视频检索系 统,提供了一套供人们在Web上搜索和检索图像及视频的工具[4]。 (3) VideoQ VideoQ是哥伦比亚大学研究的一个项目,它扩充了传统的关键字和主题导航 的查询方法[5],允许用户通过大量的视觉特征和空间关系进行检索。该系统设计 的目的在于研究基于对象的视频内容检索所有的视觉特征。其研究的主要成果包 括:视频内物体的自动分割和追踪、一个包含了大量特征的数据库(颜色、纹理、 形状、运动矢量)、多对象的视频检索、视频镜头的自动分割。 (4) PhotoBook 美国麻省理工学院媒体研究室研究的PhotoBook系统能够支持相似性图像的 检索,可以利用人脸、形状、纹理、相片簿等分别对人脸图像、工具和纹理进行 基于内容的检索[6],并随后在Virage系统中又进一步发展了将多种检索特征

您可能关注的文档

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档