一种基于压缩域的镜头检测算法【DOC精选】.docVIP

  • 2
  • 0
  • 约5.28千字
  • 约 9页
  • 2017-02-16 发布于江苏
  • 举报

一种基于压缩域的镜头检测算法【DOC精选】.doc

一种基于压缩域的镜头检测算法【DOC精选】

文章编号: 1673- 5196( 2008) 06- 0097- 05 一种基于压缩域的镜头检测算法 摘要: 针对传统的非压缩域镜头检测算法数据量大、运算量大和效率低的缺点, 提出一种基于压缩域的镜头检测算 法. 该算法首先根据M PEG 压缩标准, 从视频流中提取DCT 系数, 然后经预处理得到每一帧的DC 系数, 最后依 DC 系数建立镜头检测信息系统模型, 依分割模型产生视频镜头. 实验结果表明, 此算法相对传统非压缩域算法运 算量和数据量大大减少, 提高了算法效率. 关键词: 镜头; 镜头检测; I 帧 随着多媒体技术和网络技术的飞速发展, 视频 在多个领域得到广泛应用. 如何对这种非结构化数 据进行组织、表达、管理、查询和检索成为目前的迫 切需求. 基于内容的视频检索( content-based video retrieval, CBV R) 成为近年来研究的热点 镜头检测更是研究的焦点. 对目前常用的镜头检测方法进行了总结, 包括灰度分割法、边缘分割 法、彩色直方图分割法、MPEG 的视频分割方法、块 匹配镜头检测方法、统计判决镜头检测方法、基于聚 类的镜头检测方法和镜头渐变的检测等. 文献[ 2] 提 出了一种基于对分查找的镜头检测算法, 此算法 通过对分查找的策略形成二叉树, 同时通过广度优 先搜索寻找分割点, 能够较好地实现镜头的分割. 文 献[ 3] 提出了一种改进的镜头检测算法, 即基于传统 方法的阈值自适应镜头边界检测方法, 此方法结合 多种镜头检测的优点, 扬长避短, 在一定程度提高了 镜头检测的效率. 以上算法在理论上均具有可行性, 但由于算法在非压缩域进行, 整个处理过程需要压 缩、计算、解压和再计算的复杂过程, 因此在实际应 用中效率并不是很理想, 特别是随着视频数据的急 剧增加, 算法的效率明显下降. 文献[ 4] 虽然提出了 一种基于压缩域的视频摘要研究方法, 给研究基于 内容的视频检索提供了思路, 但距真正的基于压缩 域的视频检索仍有距离. 相关理论的基础上, 得出I 帧是视频流的基础帧, 压 缩时采用帧内压缩, 即消除了空间上的冗余性, 但保 留了视频帧图像的主要信息. 而且由于I 帧采用 DCT 变换, 因此DCT 变换后的系数是反应每一帧 视频的唯一信息表现者. 可以直接对DCT 系数进 行分析而达到分析每一帧视频的目的. 1 相关概念与理论 1. 1 DCT 变换 余弦变换是傅里叶变换的一种特殊情况. 在傅 里叶级数展开式中, 如果被展开的函数是实偶函数, 那么, 其傅里叶级数只包含余弦项, 再将其离散化, 由此可导出余弦变换, 或称之为离散余弦变换( discrete cosine t ransform, DCT) [ 5] . DCT 是一种正交变换, 它将信号从空间域变换 到频率域[ 6] . 在频率域中, 大部分的能量集中在少数 几个低频系数上, 而且代表不同空间频率分量的系 数间的相关性大为减弱, 只利用几个能量较大的低 频系数就可以很好地恢复原始图像. 对于其余的那 些低能量系数, 可允许其有较大的失真, 甚至可以将 其设置为0, 这是DCT 能够进行视频帧压缩的本质 所在. 1. 2 MPEG视频压缩原理 MPEG 图像编码包含3 个成分: I 帧, P 帧和B 帧. MPEG 编码过程中, 一些帧压缩成I 帧, 另一些 压缩成P 帧, 其他的压缩成B 帧. I 帧压缩可以得到 6 B1 的压缩比而不产生任何可觉察的模糊现象. I 帧压缩的同时使用P 帧压缩, 可以达到更高的压缩 比而无可觉察的模糊现象. B 帧压缩可以达到200 B1 的压缩比, 其文件尺寸一般为I 帧压缩尺寸的 15% , 不到P 帧压缩尺寸的一半. I 帧压缩去掉图像 的空间冗余度, P 帧和B 帧去掉时间冗余度. I 帧压 缩采用基准帧模式, 只提供帧内压缩, 即把帧图像压 缩到I 帧时, 仅仅考虑了帧内的图像. I 帧压缩不能 除去帧间冗余度. 帧内压缩基于离散余弦变换 ( DCT) , 类似于JPEG 和H. 261 图像中使用DCT 的压缩标准. P 帧采用预测编码, 利用相邻帧的一 般统计信息进行预测. 也就是说, 它考虑运动特性, 提供帧间编码. P 帧预测当前帧与前面最近的I 帧 或P 帧的差别. B 帧为双向帧间编码. 它从前面和后 面的I 帧或P 帧中提取数据. B 帧基于当前帧与前 一帧和后一帧图像之间的差别进行压缩[ 7] . 2 基于I 帧的镜头检测算法 由以上分析可知, I 帧是MPEG 压缩域中的关 键帧, 带有视频流的主要信息, 其信息以DCT 的 DCT 系数形式表现, 基于I 帧的镜头检测算法就是 在对DCT 系数相关处理的基础上进行数学模型的 构建及

文档评论(0)

1亿VIP精品文档

相关文档