- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                基于视频信息分割分类索引方法初步研究
                    基于视频信息分割分类索引方法初步研究
    【摘 要】本文对视频信息检索的索引方法作一初步探讨,该方法包括:对视频内容进行分割;分割后具代表性的对象赋予数据特征;对视频内容按检索要求进行分类(层);分割对象与检索类型建立对应关系,从而建立索引和检索体系。 
  【关键词】视频 索引 分割 分类 对应关系 
  一、研究背景与研究思路 
  所谓视频,通俗的说,就是随时间变化的图像。由于数字影像技术的飞速发展及网络的普及,视频信息面广量大,种类庞杂,使人目不暇接。面对浩瀚如海的视频信息,人们要查找时往往不知从何入手,迫切希望能像检索文本信息数据那样,通过类似关键词的信息索引,快速查找到所需要的视频信息。要实现这样的要求,首要条件是构建快速而有效的索引方法,为快速检索奠定基础。现阶段,动态的视频信息的检索大多还处于研究状态,有些处于实验性模型,有些只适用于某些特殊范围视频信息的检索①。总之,就目前而论,似还没有能较普遍使用的视频信息检索和索引方法。本文作为这一研究领域的一个尝试,试就视频信息检索的索引方法作一初步研究。 
  本文研究的基本思路是:对视频内容的隐含结构进行分割;分割后具代表性的对象赋予数据特征;对视频内容按检索要求进行分类;分割对象与检索类型建立对应关系,从而建立索引和检索体系。 
  二、分割视频信息结构,选取索引对象 
  视频一般表现形式为节目,通过节目反映某个故事或主题。视频存储的数据并没有明显的索引信息,人们通常采用直线递进的方式欣赏和浏览。由于消费者的职业、志趣等方面的差异,人们对视频信息的消费可分成不同的类型。例如,以娱乐、观赏为目的的“消费型”,以教学、比赛等为目的的“研究型”,以视频本身的构造、修改、完善为目的的“创作型”,以视频信息为工具或载体的“应用型”等等。不同的用户检索视频信息的目的要求可能不同,有的需要检索的对象可能是镜头,也有的需要检索的对象可能是场景或者是故事单元。例如,跨栏运动员可能需要查找刘翔起跑的视频镜头,教师备课可能需要参考某段教学录像等等。所以,要建立高效的、操作性强的视频信息检索索引体系,必须对视频信息的内在结构进行分解细化,进而从中有针对性地选取索引对象。 
  1、视频信息的内在结构分析 
  一部视频类似于一本书,一本书的结构有书名(标题)、章、节、段落、句子、字词等层次构成。视频也是如此,对一部视频节目进行细化分析,可以发现,按由高到低的顺序,视频可以分解成节目(名称)、故事单元、场景、镜头、帧等层次②。其中,帧是最小的组成元素,是一个个静止的图像,类似于书中的字词;针对某个对象用摄像机拍摄得到的帧的集合是一个镜头,镜头类似于书中的句子;描述某一地点的或某一对象的、具有相对独立的叙事情节的若干连续镜头组成一个场景,场景类似于书中的段落;描述某一事件的具有相对完整的故事情节的若干个连续场景的集合构成一个故事单元,故事单元类似于书中的章或节;一个或多个故事单元构成一个节目,那就相当于若干章节构成一本书了。所以,视频信息的结构分析,与文本信息的结构分析,思想方法是一样的,可以按由高到低的顺序,也可以按由低到高的顺序。 
  2、视频索引对象的选取 
  如上所述,一部视频由节目、故事单元、场景、镜头、帧等这些层次所组成。由于消费者检索的目的要求不同,因此,索引对象也可能不同,节目、故事单元、场景、镜头、帧等都可能作为索引对象。这些对象面广量大,作为索引对象,自然应该具有代表性和关键性,因此,各层次索引对象的选取是建立索引体系的关键环节。 
  (1)帧的选取。帧是视频信息中的原始对象,是一个个固定的图像,其数量众多,拍摄时每秒几个或几十个。这些帧不可能都作为索引对象。这就需要利用适当的方法,从中选取一定数量的能够适应有关检索要求的具有代表性的关键帧作为索引对象。关键帧的选取方法有基于视频的分段和非基于视频的分段两种,具体方法有无监督聚类选取算法、基于公差带的方法等。 
  (2)镜头分割。镜头是视频信息构成的基本元素。根据镜头在视频节目中作用划分,镜头可分为交代镜头、动作镜头和空镜头等三种类型。交代镜头通常是用远景、全景等大景别的画面,交代场景中景物的空间位置或相互关系,表现人物的运动方式和运动轨迹等;动作镜头是视频节目的主要镜头,主要用以表现人物的形体语言、面部表情和运动状态;空镜头一般是指没有人物活动的镜头,通常用远景或特写两极景别表达,其作用是调整叙事结构、情绪基调和视觉感受。视频镜头分割是一项比较复杂的技术,需综合运用统计学、电子学、计算机等方面的知识。近几年,随着电子技术和计算机技术的飞速发展,镜头分割技术有了长足进步,开发出许多镜头分割的方法。总的说来,镜头分割技术有基于非压缩的和基于压缩的两大类。基于非压缩的镜头分割方法有象素比较法、块匹配似然比法、直方
                
原创力文档
                        

文档评论(0)