《Blog信息::》.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《Blog信息::》.doc

::Blog信息:: 名称: jdsun 作者: jdsun 域名: /pc/index.php?id=jdsun 站点: BBS 泉韵心声站 档案日期:2004-12-01 00:00:00 ~ 2005-01-01 00:00:00 2004-12-23 09:08:48 主题: 基于内容的视频检索技术 人们总是希望可以直接检索到一段包含特定信息的视频片段,例如:足球比赛中的射门镜头、含有日出景色的片断等。基于内容的视频检索技术因此应运而生。   基于内容的视频检索,就是根据视频的内容和上下文关系,对大规模视频数据库中的视频数据进行检索。它提供这样一种算法:在没有人工参与的情况下,自动提取并描述视频的特征和内容。这是一门交叉学科,以图像处理、模式识别、计算机视觉、图像理解等领域的知识为基础,从认知科学、人工智能、数据库管理系统及人机交互、信息检索等领域,引入新的媒体数据表示和数据模型,从而设计出可靠、有效的检索算法、系统结构以及友好的人机界面。目前,基于内容的视频检索研究,除了识别和描述图像的颜色、纹理、形状和空间关系外,主要的研究集中在视频分割、特征提取和描述(包括视觉特征、颜色、纹理和形状及运动信息和对象信息等)、关键帧提取和结构分析等方面。   帧/镜头/场景   在讨论基于内容的视频检索中的关键技术之前,让我们先了解几个基本概念:   · 帧 视频可以看作是一个连续静态图像的序列,其中的每一幅静态图像称为一帧。   · 镜头 由摄像机记录下来的一段连续的帧序列,它是一段视频的物理组成单元。   · 关键帧 一幅能描述镜头主要内容的帧。根据内容的复杂程度,一个镜头可以有一个或多个关键帧。   · 场景 由一些语义相关的镜头组成,这些镜头不一定在时间上连续。场景描述了一个独立的故事单元(或者说是一个高层概念),它是一段视频的语义组成单元。   一段视频的典型结构如图1所示。一般来说,一段视频由一些描述独立故事单元的场景构成;一个场景由一些语义相关的镜头组成;而每个镜头是由一些连续的帧构成,它可由一个或多个关键帧表示。   图1 视频结构   基于内容的视频分析,就是要从所有的帧中提取主要内容,并从下至上地对视频内容进行结构化描述。为了实现这个目标,我们须对视频进行如下处理:视频切分、特征提取和视频内容组织等。   图2 基于内容的视频处理过程   图2描述了基于内容的视频处理的主要过程。视频首先被分割成各个镜头,并对每个镜头进行运动分析(主要针对摄像机运动和物体运动)。基于运动分析,我们可以提取并跟踪镜头中的对象,同时选择或构造关键帧,来描述视频内容。然后,根据提取镜头、关键帧和对象的视觉特征,进行索引。通过视觉特征的相似度计算,镜头被组织成场景。最终,用户可以通过一种简单方便的方法浏览和检索视频。   关键技术   镜头分割 通常视频流中的镜头,是由时间连续的视频帧组成的。它对应着摄像机一次纪录的起停操作,代表一个场景在时间上和空间上的连续的动作。镜头之间有多种类型的过渡方式,最常见的是“切变”,表现为在相邻两帧间发生的突变性的镜头转换。此外,还存在一些较复杂的过渡方式,如淡入、淡出等。镜头分割方法分为非压缩域和压缩域两类。   特征分析 基本的特征分析包括:颜色、纹理、形状、运动和对象等。前三种是图像和视频共有的,属于数字图像处理中较为成熟的技术。对象提取和跟踪,是视频分析中最困难的部分,可利用运动信息进行处理:先将每帧图像分割成具有相似视觉特征(颜色、纹理等)的区域,然后根据各个区域的运动特征,按照一定的约束(例如区域之间的连通性),将它们合并成对象。国际标准MPEG-4便是以对象提取和合成作为焦点的,它提出了使用VOP(视频对象平面)的概念,对视频对象进行索引。MPEG-7更提出对各种视频对象信息进行描述和查找。   关键帧提取 为了克服基于镜头的方法存在的问题,人们提出了一种基于内容分析的方法。这种方法通过分析视频内容(颜色直方图、运动信息)随时间的变化情况,来选取所需关键帧的数目,并按照一定的规则为镜头抽取关键帧。当然还有其它的方法,如用无监督聚类技术来选择关键帧等。   视频结构分析 视频结构分析的过程,就是将语义相关的镜头组合、聚类的过程。举例来说,假设有一段两人对话的视频段,在拍摄过程中,摄像机的焦点在两人之间来回切换,用我们前面所述的镜头分割技术,必然会把这一段视频分割为多个镜头。而这一组在时间上连续的镜头是相关的,因为这一组镜头是一个情节(称为场景)。结构分析的目的,便是使视频数据形成结构化的层次,可以方便用户进行有效的浏览。   前景展望   基于内容的多媒体检索技术,将会在以下领域中得到更广泛的应用:数字图书馆、网络多媒体搜索引擎、交互电

文档评论(0)

ddwg + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档