基于内容视频镜头回放系统研究与实现61472.docVIP

基于内容视频镜头回放系统研究与实现61472.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容视频镜头回放系统研究与实现

基于内容视频镜头回放系统研究与实现61472   摘要:长期以来,监控视频的回放大都是通过传统的拖拽方式或者定位到特定时间段来得到特定镜头信息,由于视频数据的海量性,这种方法很难快速准确找到特定的需求信息。文章使用彩色直方图技术对视频进行镜头突变检测,实现了通过关键帧图片对视频进行基于内容的镜头回放。   关键词:彩色直方图;突变检测;基于内容的镜头回放   中图分类号:TP301.6 文献标识码:A 文章编号:1000-8136(2010)30-0001-02      21世纪将是信息时代,多媒体信息日益成为主要的数据资源,人们所获取的信息除了传统的文本之外,大量的声音、图像甚至视频数据得到广泛应用。如何对这些数据进行有效地管理和使用,已成为迫切需要解决的问题。基于内容的视觉信息检索技术(Content-Based Video Retrieval,CBVR)随之诞生,得到了国内外多媒体信息领域科技人员的广泛重视和研究,迅速成为多媒体,特别是图像、视频和数据库技术中的研究热点。   CBVR技术可以广泛应用于各种工业、科研领域,如远程监控、多媒体会议、虚拟现实、电视新闻、卫星云图、信息娱乐、交互式数字电视、交互电子商务和视频数字图书馆,尤其值得一提的是交互式数字电视和视频数字图书馆,其广阔的发展前景和巨大的商业价值是其蓬勃发展的强有力的助推剂。   本文借助于彩色直方图,实现了一个基于内容的视屏镜头回放系统VideoRetrievalPlatForm。   1彩色直方图   1.1颜色空间   图像颜色可分为无彩色和有彩色两大类。[1]由于各项技术的进步,无彩色的图像正在逐渐被彩色图像取代。根据人眼结构,所有颜色都可看作是3个基本颜色――红(R,red)、绿(G,green)和蓝(B,blue),不同组合研究人员先后提出了许多种颜色空间(color spaces),[2]如主要用于彩色显示的RGB或彩色处理的HSI空间等。绝大多数彩色图像显示器都采用RGB三色构成图像,Windows操作系统的多数图像格式也以RGB模型作为图像存储的数据。归一化(Normalized)的NRGB(RGB)颜色模型,由于其可以部分规避颜色受阴影及光照变化的影响,[3]在视频图像特征提取中应用广泛,其定义如下:   RN=R/S,GN=G/S,BN=B/S,S=R+G+B (1)   1.2直方图   直方图描述了图像中的颜色分布,是图像中最为可靠的特征。[4]颜色直方图法的核心思想是在一定的色彩空间中对图像各种色彩出现的频数进行统计。首先将颜色区间划分为N个离散的颜色子区间,计算每帧图像中落入每个子区间的像素数目,得到其颜色直方图,然后计算两帧图像直方图的差值,作为距离测度。   全局彩色直方图匹配算法使用整幅图像像素色彩的统计值计算图像之间的帧差。若将颜色空间分割为N个子区间,hi(k)和hj(k)分别表示第i帧和第j帧落入第k个颜色子区间的象      素数目,则两帧间的距离测度函数可以定义如下:   (2)   本文系统采用NRGB空间下的全局彩色直方图,子区间的分割及突变转换检测阈值的确认,参照文献的研究,直方图将0~255的颜色空间划分为64个子区间,同时选取全部帧均差ADF的5倍作为突变转换检测阈值,可以保证比较高的查全率(reacll)和查准率(precision)。   2系统设计   2.1功能及模块   VideoRetrievalPlatForm视频镜头浏览系统,采用彩色直方图技术,数据分析依赖DirectShow SDK,实现了视屏播放,按帧进退,镜头突变检测,镜头关键帧存储,视频镜头按照关键帧回放等功能。包含5个基本模块,分别为视频信息分析模块、视频播放模块、镜头检测模块、镜头浏览模块、数据库操作模块。   2.2系统框架   由于本系统涉及到对视频媒体原始数据流的操作和分析,所以选择Microsoft公司的VC++.Net 2005平台,众所周知,VC++对于图像和多媒体处理方面功能强大。在视频帧的获取和分析方面,采用DirectX 9.0 SDK的成员之一Direct Show SDK。   VideoRetrievalPlatForm的设计基本遵循通用的视频镜头检索模型,镜头的突变检测算法采用基于全局彩色直方图见图1,数据分析依赖DirectShow框架。      图1基于内容的视频浏览系统框架      2.3系统中的功能类设计   为了使系统具有比较好的可扩展性和管理性,采用了类的设计思想,按照Direct Show的运行原理和系统分析的需要,实验中主要设计了十个类,见表1。   表 1VideoRetrievalPlatForm 类设计   

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档