基于CDF97小波和自适应Otsu算法视频字幕分割.docVIP

下载本文档

7
0
约4.67千字
约 9页
2018-08-27 发布于福建
举报
版权申诉

基于CDF97小波和自适应Otsu算法视频字幕分割.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于CDF97小波和自适应Otsu算法视频字幕分割

基于CDF97小波和自适应Otsu算法视频字幕分割　　摘要：提出了一种基于CDF9?7小波和自适应Otsu算法的视频图像字幕分割算法。首先从视频中截取视频图像，并对其进行灰度化等预处理，其次对预处理后的图像进行CDF9?7小波变换，获取其水平和垂直的高频分量HH，然后使用自适应Otsu算法分割出该高频分量图像中的字幕区域。实验表明，该算法分割效果良好，具有一定的鲁棒性和自适应性。以这些区域为基础，可以进一步完成诸如视频字幕识别等图像分析、理解和识别操作。　　关键字： CDF9?7小波；自适应Otsu算法；视频字幕；图像分割　　中图分类号： TN911.73?34； TP391.1 文献标识码： A 文章编号： 1004?373X（2014）09?0050?03 　　0 引言　　视频是依据人眼视觉暂留原理，存储的看上去平滑连续而实际上动态捕捉的一系列的静态照片，已经成为互联网上除文字、声音之外最重要的媒体形式，对其自动分析与理解已经成为当前网络监管的重要研究内容。视频图像中的文字隐含了非常丰富的高层语义信息，对其分割、定位、识别、理解和检索具有重要的现实意义。从这些处理步骤来讲，分割和定位操作是字符识别、理解和检索等高层处理的基础，直接影响着高层处理的成功率和精确度。字幕作为视频中最重要的文字，有的以独立的字幕文件存在，而有的被嵌入在视频图像中。独立存在的字幕文件往往仅包含时间区间和文本信息，比较容易处理，而嵌入在视频图像中的字幕就必须首先进行图像分割操作，然后采用适当算法定位这些文字的区域。　　图像分割就是把图像分解成有限个感兴趣的和特质相关的区域的一种操作，是图像分析、理解和识别操作的基础，因此研究人员从各个学科出发，提出并不断改进了很多图像分割方法。目前主要的分割方法有基于阈值设定、基于边缘检测、基于区域、基于聚类分析、基于模糊集理论[1]，以及基于群体智能[2]等众多分割方法。这些算法各有优缺点，存在的主要问题是适用范围的局限性和较低的准确性及鲁棒性。本文提出的CDF9?7小波变换结合自适应Otsu算法的视频图像分割方法，对于视频图像中字幕区域的分割效果良好。　　1 视频图像分割步骤　　本文给出的分割方法总体来说有三步。首先，先从视频中获取视频图像，对彩色图像则要进行去噪和灰度化等预处理。目的在于尽可能削弱图像背景级噪声对字幕文字的相关性。然后，对预处理后的图像进行CDF9?7小波变换，获取其水平和垂直方向的高频分量HH。因为CDF9?7小波是满足线性相位要求的非常适用于图像处理的双正交小波，而视频字幕区域背景和字幕颜色往往对比度高，边缘信息和高频分量丰富。最后，使用自适应Otsu算法找出该高频分量中的最佳阈值，分割出图像中包含字幕文字的有效区域。　　1.1 CDF9?7小波　　9?7小波是一个双正交小波[3]，其正交性体现在母小波[ψ]及其对偶母小波[ψ]之间，[ψ]和[ψ]本身没有正交性，即[=δm，jδn，k]，对应地其尺度函数[?]及其对偶尺度函数[?]也满足正交关系，即[=δm，jδn，k]，[ψ]和[ψ]构成一对[L2（R）]空间的双正交小波基。正交小波可视为是在[ψ=ψ]时的双正交小波的特例。虽然相对正交小波，9?7双正交小波正交性放宽或者说变弱，但是它具有很好的对称性和线性相位特性。其滤波器系数获取可以通过求解约束PR条件得到。但约束条件毕竟只是必要条件，为使无穷乘积收敛，Cohen、Daubechies和Feauveau提出了以它们名字首字母命名的CDF方法，在求解时增加了新的消失矩条件，求解出了系数和没有消失矩条件略有不同的9?7小波，可记为CDF9?7小波。这种小波除了原有的对称性和线性相位这些优点外，支撑区间变小且收敛更快，正是由于CDF9?7小波的这些优秀特征，因而被广泛用于图像处理等领域，目前已经成为了JPEG 2000有损图像压缩标准中的默认小波。但在具体实现中，由于图像数据量往往很大，为提高运行效率，往往并不直接采用离散小波变换的快速算法（MALLAT算法），而是对CDF9?7小波进行提升实现，在同等条件下，运算速度和效率较MALLAT算法提高2倍。　　CDF9?7小波对二维图像变换的步骤是，首先用分析滤波器[h，g]对图像（记为[cj+1l，n]）的列做小波变换，得到低频部分[nhn-2mcj+1l，n]和高频部分[ngn-2mcj+1l，n]。然后对低频部分的行做小波变换，得到低频中的低频分量[cjk，m]（记为LL）和低频中的高频分量[dj，1k，m]（记为HL）；对高频部分的行做小波变换，得到高频中的低频分量[dj，2k，m]（记为LH）和高频中的高频分量[dj，3k，m]（记为HH）。以上分解也可以先做行小波变换再做列小波