基于内容的视频检索技术 .pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于内容的视频检索技术

【摘要】本文首先介绍了基于内容的视频检索技术含义、基于内容的视频检

索的特点及现状,其次探讨了镜头边界检测、关键帧的选取、特征提取及视频聚

类。本文的讨论具有重要的理论价值,同时也为基于内容的视频检索技术提供依

据。

【关键词】基于;内容;视频检索;技术

一、前言

自从改革开放以来,我国的信息技术取得了前所未有的发展,同时也推动着

其他行业的发展。视频检索技术就是近年来发展起来的对众多视频检索的技术,

对我们的需要提供重大帮助。

二、基于内容的视频检索技术含义

视频检索就是要从大量的视频数据中找到所需的视频片断。传统的视频检索

只能通过快进和快退等顺序的方法人工查找,因而是一件非常繁琐耗时的工作,

这显然已无法满足多媒体数据库的要求。用户往往希望只要给出例子或特征描

述,系统就能自动地找到所需的视频片断点,即实现基于内容的视频检索。

基于内容的视频检索包括很多技术,如视频结构的分析、视频数据的自动索

引和视频聚类。视频结构的分析是指通过镜头边界的检测,把视频分割成基本的

组成单元———镜头;视频数据的自动索引包括关键帧的选取和静止特征与运动

特征的提取;视频聚类就是根据这些特征进行的。

三、基于内容的视频检索的特点及现状

1、基于内容的视频检索的特点

(1)从视频数据中提取信息线索。基于内容的检索突破了传统的基于表达式

检索的局限,它直接对图像、视频、音频内容进行分析.抽取特征和语义,利用

这些内容特征建立索引。并进行检索。

(2)CBVR是一种近似匹配。由于对内容的表示不是一种精确描述,因此,

CBVR采用相似性匹配的方法逐步求精,以获得查询结果,即不断减小查询结果

的范围,直到定位于要求的目标,这是一个迭代过程。这一点与常规数据库检索

中的精确匹配方法不同。

(3)大型数据库(集)的快速检索。实际的视频数据库(集)数据量巨大,因此要

求CBVR技术也像常规的信息检索技术一样,能快速实现对大型库的检索。

(4)人机交互。人对于物体的内容特征比较敏感,能迅速分辨对象的轮廓、

音乐旋律及它们的含义等,但对于视频对象,一方面人工从大量数据中标志对象

非常费时,另一方面人的判断易受主观性影响,且是一种重复性工作,而这些正

是计算机的长处。因此人与计算机间应相互合作进行检索。

2、基于内容的视频检索技术的现状

目前视频检索,更多的是在研究阶段。研究项目包括CarnegieMellon大学

的Informeda数字视频图书馆项目、IBMAltadena研究中心研究开发的QBIC、

美国堪萨斯大学的数字视频图书馆系统(DVLS)、微软研究中心等。Carnegie

Mellon大学的Informedia数字图书馆项目由NSF,DARPA,NASA等资助,

Informedia项目致力于研究新的方法进行自动的视频和音频的检索、浏览、检索

和内容提取,并集成在一个系统中,用于教育、信息和娱乐等行业。Informedia

项目发展智能、自动的视频内容分析机制以普及数字视频图书馆的应用,在语音

识别、图像认知、自然语言处理等领域的研究为基于内容和知识的自动检索和内

容提取提供了支持。

四、镜头边界检测

1、镜头转换边界检测的意义

从视频的制作过程可以了解视频的结构。在制作视频时,首先进行单个镜头

的拍摄,每个镜头是由摄像机一次连续拍摄下了的多个画面帧组成,反映了一段

连续发生的事件。然后,内容相近的多个镜头通过各种镜头编辑方式(即镜头转

换方式)衔接在一起,组成场景以及视频故事单元。从视频的制作过程可以看出,

镜头是组成视频的基本单元,也是对视频内容进行深入分析的基础。在基于视频

内容的视频检索中,为了测览或检索视频数据库,需要对每个场景的开始点和结

束点进行识别和索引。

2、镜头边界检测方法

镜头边界检测方法可分为模板匹配法、直方图法、基于边缘的方法等3种。

(1)、模板匹配法

模板匹配法的缺点是对噪声和镜头或物体运动非常敏感,因为它严格地局限

于像素的位置。噪声和物体运动都会使帧间差增大,从而导致错误的场景转换检

测。对此有人提出了一种改进的方法,即把各帧划分为454像素的小块,并对

每个块取平均,再用这个平均值对前后帧的对应小块进行比较,这种方法可以

文档评论(0)

176****0728 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档