- 14
- 0
- 约4.67千字
- 约 9页
- 2018-08-18 发布于湖北
- 举报
基于CDF97小波和自适应Otsu算法的视频字幕分割
摘 要: 提出了一种基于CDF9?7小波和自适应Otsu算法的视频图像字幕分割算法。首先从视频中截取视频图像,并对其进行灰度化等预处理,其次对预处理后的图像进行CDF9?7小波变换,获取其水平和垂直的高频分量HH,然后使用自适应Otsu算法分割出该高频分量图像中的字幕区域。实验表明,该算法分割效果良好,具有一定的鲁棒性和自适应性。以这些区域为基础,可以进一步完成诸如视频字幕识别等图像分析、理解和识别操作。
关键字: CDF9?7小波; 自适应Otsu算法; 视频字幕; 图像分割
中图分类号: TN911.73?34; TP391.1 文献标识码: A 文章编号: 1004?373X(2014)09?0050?03
0 引 言
视频是依据人眼视觉暂留原理,存储的看上去平滑连续而实际上动态捕捉的一系列的静态照片,已经成为互联网上除文字、声音之外最重要的媒体形式,对其自动分析与理解已经成为当前网络监管的重要研究内容。视频图像中的文字隐含了非常丰富的高层语义信息,对其分割、定位、识别、理解和检索具有重要的现实意义。从这些处理步骤来讲,分割和定位操作是字符识别、理解和检索等高层处理的基础,直接影响着高层处理的成功率和精确度。字幕作为视频中最重要的文字,有的以独立的字幕文件存在,而有的被嵌入在视频图像中。独立存在的字幕文件往往仅包含时间区间和文本信息,比较容易处理,而嵌入在视频图像中的字幕就必须首先进行图像分割操作,然后采用适当算法定位这些文字的区域。
图像分割就是把图像分解成有限个感兴趣的和特质相关的区域的一种操作,是图像分析、理解和识别操作的基础,因此研究人员从各个学科出发,提出并不断改进了很多图像分割方法。目前主要的分割方法有基于阈值设定、基于边缘检测、基于区域、基于聚类分析、基于模糊集理论[1],以及基于群体智能[2]等众多分割方法。这些算法各有优缺点,存在的主要问题是适用范围的局限性和较低的准确性及鲁棒性。本文提出的CDF9?7小波变换结合自适应Otsu算法的视频图像分割方法,对于视频图像中字幕区域的分割效果良好。
1 视频图像分割步骤
本文给出的分割方法总体来说有三步。首先,先从视频中获取视频图像,对彩色图像则要进行去噪和灰度化等预处理。目的在于尽可能削弱图像背景级噪声对字幕文字的相关性。然后,对预处理后的图像进行CDF9?7小波变换,获取其水平和垂直方向的高频分量HH。因为CDF9?7小波是满足线性相位要求的非常适用于图像处理的双正交小波,而视频字幕区域背景和字幕颜色往往对比度高,边缘信息和高频分量丰富。最后,使用自适应Otsu算法找出该高频分量中的最佳阈值,分割出图像中包含字幕文字的有效区域。
1.1 CDF9?7小波
9?7小波是一个双正交小波[3],其正交性体现在母小波[ψ]及其对偶母小波[ψ]之间,[ψ]和[ψ]本身没有正交性, 即[=δm,jδn,k],对应地其尺度函数[?]及其对偶尺度函数[?]也满足正交关系,即[=δm,jδn,k],[ψ]和[ψ]构成一对[L2(R)]空间的双正交小波基。正交小波可视为是在[ψ=ψ]时的双正交小波的特例。虽然相对正交小波,9?7双正交小波正交性放宽或者说变弱,但是它具有很好的对称性和线性相位特性。其滤波器系数获取可以通过求解约束PR条件得到。但约束条件毕竟只是必要条件,为使无穷乘积收敛,Cohen、Daubechies和Feauveau提出了以它们名字首字母命名的CDF方法,在求解时增加了新的消失矩条件,求解出了系数和没有消失矩条件略有不同的9?7小波,可记为CDF9?7小波。这种小波除了原有的对称性和线性相位这些优点外,支撑区间变小且收敛更快,正是由于CDF9?7小波的这些优秀特征,因而被广泛用于图像处理等领域,目前已经成为了JPEG 2000有损图像压缩标准中的默认小波。但在具体实现中,由于图像数据量往往很大,为提高运行效率,往往并不直接采用离散小波变换的快速算法(MALLAT算法),而是对CDF9?7小波进行提升实现,在同等条件下,运算速度和效率较MALLAT算法提高2倍。
CDF9?7小波对二维图像变换的步骤是,首先用分析滤波器[h,g]对图像(记为[cj+1l,n])的列做小波变换,得到低频部分[nhn-2mcj+1l,n]和高频部分[ngn-2mcj+1l,n]。然后对低频部分的行做小波变换,得到低频中的低频分量[cjk,m](记为LL)和低频中的高频分量[dj,1k,m](记为HL);对高频部分的行做小波变换,得到高频中的低频分量[dj,2k,m](记为LH)和高频中的高频分量[dj,3k,m](记为HH)。以上分解也可以先做行小波变换再做列小
您可能关注的文档
- 基于 “战略―系统”思维的特种设备监管模式及体系研究.doc
- 基于.NET的LINQ to SQL 三层架构的研究与实现.doc
- 基于.NET的高校教学督导信息化服务系统设计与实现.doc
- 基于.NET的网络考试系统的设计与开发.doc
- 基于.NET的农作物育种助手软件的研发.doc
- 基于[SVAR]模型的中国货币政策有效性分析.doc
- 基于“MRC”模型的工会文体活动组织模式柔性化研究.doc
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)英语word版含答案.docx
- 福建省龙海市第二中学2017-2018学年高一下学期第二次月考试题(6月)语文word版含答案.docx
- 基于“城市触媒理论”的历史片区复兴规划探究.doc
- 辞退员工补偿协议书范本推荐6篇.docx
- 中职电子商务运营与跨境电商平台策略的课题报告教学研究课题报告.docx
- 初中物理教学中植物蒸腾作用实验与节水技术设计课题报告教学研究课题报告.docx
- 基于人工智能的跨学科教学知识整合与迁移的智能教学策略在远程教育中的应用效果评估教学研究课题报告.docx
- 2026年樱桃深加工行业营销策略报告.docx
- 五年(2021-2025)中考数学真题分类汇编(江西专用)12:概率与统计(60题)(教师版).docx
- 2026年生物降解塑料材料十年市场机遇报告.docx
- 中职学生对AI机器人焊接技术的职业发展前景课题报告教学研究课题报告.docx
- 智慧校园学习资源语义标注与智能检索的智能化教学环境构建研究教学研究课题报告.docx
- 《社区卫生服务中心中医药适宜技术推广的社区参与模式研究》教学研究课题报告.docx
最近下载
- 员工奖金保密协议9篇.docx VIP
- 2025年东莞市东华初级中学中考数学模拟试卷附答案解析.pdf
- 2026年河南质量工程职业学院单招职业适应性测试备考题库及答案解析.docx VIP
- 2024年河南质量工程职业学院单招职业适应性测试试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库有答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性考试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试备考试题及答案解析.docx VIP
- 2026年河南质量工程职业学院单招职业适应性测试题库及答案解析.docx VIP
- 6.1《北方地区自然特征与农业》课件-2023-2024学年人教版地理八年级下册.pptx VIP
- 2025年高考英语全国卷Ⅰ续写分析与教学策略.pptx VIP
原创力文档

文档评论(0)