基于内容的视频信息检索模型及方法综述.pptxVIP

下载本文档

1
0
约2.01千字
约 25页
2017-08-25 发布于河南
举报
版权申诉

基于内容的视频信息检索模型及方法综述.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于内容的视频信息检索模型及方法综述研一郭玉会引言视频检索简介基于内容的视频检索模型视频信息检索的方法分析总结引言随着信息时代的到来，特别是计算机技术和网络技术的发展，海量的信息在全球被采集、传输、流通和应用。由于越来越多的视觉信息数据库的建立和人们对视觉信息越来越多的需求，视觉信息的描述和检索已经成为了当今研究的热点，如何有效的描述视觉信息、如何实现基于内容的信息检索等一系列问题成为多媒体信息相关部门努力研究的重点。基于内容的视觉信息检索大体上分为两类：基于内容的图象信息检索和基于内容的视频信息检索。本文主要对基于内容的视频信息检索技术进行相关的讨论。视频检索简介传统视频检索基于内容的视频检索传统视频检索视频检索就是要从大量的视频数据中找到所需要的视频片段。传统视频信息管理系统是通过访问字符串属性的方式查询视频信息。在系统的描述端，使用相关模型、框架模型、面向目标的模型等表达方案，用字符串表达与内容无关的原数据。在系统的查询端使用同样的文字标识符，借助于对视频的编号通过标签来匹配，使对视频的检索变成了对标签的检索。传统视频检索系统的优点是：简单、快速。缺点是：单纯基于文本，难以实现有效的管理和检索的准确性（1）模糊性视频信息内容的丰富性决定了很难用语言标签准确、完整的描述视频信息的全部内容，这就使得对视频信息的描述存在很大的模糊性（2）不确定性文字描述是对视频信息的一种特定的抽象，这就要求描述方法要符合一定的标准，如果标准改变了，描述方法就要改变。（3）准确性低随着人们对信息依赖性的加强，人们对视频资料中包含的具体信息的需求也越来越多。传统的对视频的描述都是通过手工注释完成的，所以使准确性大大降低。（4）主观因素由于文字标签都是通过观察者选定后加在视频标签上的，因此视频描述很大程度上受到主观因素的影响，不同的观察者或同一个观察者在不同的条件下对同一幅图像会给出不同的描述，有时这种差异会很大。基于内容的视频信息描述方案并不是放弃了传统的文本描述方式，而是最大限度的减少具有极强主观性的文本标签项，使描述系统能够客观、准确、全面的描述视频信息。基于内容的视频检索基于内容的视频检索就是指根据视频的内容及上下文关系，对大规模视频数据库中的视频数据进行检索。主要特点：（1）对视频信息的描述更加具体、客观和全面。（2）低级语义描述子低级描述子的特点之一就是可以由计算机自动提取，这就省去了从大量数据中标识对象的重复劳动，同时也极大程度的降低了文本描述信息中的主观性，大大提高了检索结果的准确性。（3）更多的视频内在信息（4）多样灵活的检索方式基于内容的概念基于内容？？？？？什么是基于内容？所谓基于内容的检索(CBR)就是指根据媒体和媒体对象的内容语义及上下文联系进行检索。基于内容检索的特点：从媒体内容中提取信息线索。直接对图像，视频、音频进行分析，抽取特征，使得检索更加媒体对象。提取特征的方法多种多样。人机交互进行。近似匹配。在检索过程中，采用逐步求精的方法。直到定位到目标。基于内容的检索可以利用图像处理、模式识别、语音信号、计算机视觉、人工智能等学科中的一些方法作为基础技术，以提高其检索精确度。基于内容的视频检索模型基于内容的视频信息检索模型视频数据处理模型中的关键技术用户端视频数据处理数据库搜索引擎基于内容的视频检索系统主要由三部分组成：用户端、可视化界面和管理端。视频类聚故事情节特征提取视频流镜头检测关键帧提取视频数据处理镜头边界的检测镜头是视频数据的基本单元。大部分视频是通过编辑由一个个镜头连接而成的，所以基于内容检索的视频处理，首先要把视频自动地分割为镜头，以作为基本的索引单元，这个过程就称为镜头边界的检测，也叫场景转换检索（SCD)，它是实现基于内容的视频检索的第一步。关键帧的选取关键帧是用于描述一个镜头的关键图像帧，它反映一个镜头的主要内容。关键帧的选取一方面必须能够反映镜头中的主要事件，因而描述应尽可能准确完全，另一方面，为便于管理数据量应尽量小，且计算不宜太复杂。特征提取视频数据的特征分为静态特征和动态特征。①静态特征提取②运动特征提取视频类聚视频聚类是研究镜头间的关系，也就是如何把内容相近的镜头组合起来。根据聚类目的的不同，视频聚类可分为两类：一类是把同属一个场景的镜头进行聚类，以形成层次型的视频结构———场景和电影。另一类聚类即对视频进行分类。它只考虑特征相似性，而不考虑时间连续性。根据镜头的重复程度，视频一般可分为对话型、动作型和其它类型。视频信息检索的方法基于内容的视频信息检索系统主要通过三种方式实现，即：（1）基于图像的方式（2）基于视频的特有信息（3）图像和视频的特有信息相结合分析总结高效快速地对视频数据进行检索，必须要对图像进行分割、提取特征、分类描述，分类结果存入相应的数据库中，最后进行相似匹配，完成查询