用MATLAB提取视频流中的文字算法的研究和实现.pdfVIP

下载本文档

15
0
约8.31千字
约 5页
2017-08-17 发布于安徽
举报
版权申诉

用MATLAB提取视频流中的文字算法的研究和实现.pdf

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

c网络电视与新媒体技术用MATLAB提取视频流中的文字算法的研究与实现华中师范大学物理科学与技术学院袁静刘时进中国传媒大学媒体信息技术研究所魏国新万烨摘要：视频流的文字信息中包含了视频的关键信息，在这篇文章里，我们提出了一种针对视频流中文字提取的新方法框架，并使用了gnTLAB视频图象处理丁具箱快速构建了这个框架，并将这个方法实现。其中重点实现了对视频中关键帧的文字区域进行识别和对识别出的文字区域进行背景和噪声滤波消减处理，最终将处理的结果二值化后通过文字识别系统(0ER)进行文字的识别。关键词：视频文字识别；文字区域分割；MATLAB 1引言视频中的文字可以直接并且集中的描述视频的各种信息，所以视频中的文字识别可以更好的帮助我们分析和理解视频中的内容。在新闻视频里，文字中经常包括人的名称和新闻事件的摘要，因此视频文字的识别可以作为视频标引的一种手段。人们已经在视频流中识别文字方向上做出了非常大的努力。出现了大量的在图像和视频流中提要依据是视频和图像中的文字比较的集中，并且和背景有不同的颜色。这种方法可以快速，准确的确定视频中的文字[2]，[3]。但是当遇到视频中的文字被嵌入到复杂的背景中或者和其他的图形对象相连接时，这种方法就不能很好的工作。(2)主要是基于纹理的分类的方法[5][6]。但是它比较难排除类似于文字的区域。还有一些方法是在压缩域进行的处理，本质上还是对基于纹理的方法。本文的重点是使用MATLAB视频图像处理工具箱，从视频流的关键帧中提取文字的区域并且分离出文字，第2节主要介绍视频流文字提取时一些需要重要考虑的问题，提取文字的假设前提和该系统的结构。从第3节主要描述本系统的每一部分的细节。第4节主要是描述系统实验的结果。第5 主要是系统应用与有待改进的一些问题。 2系统方案 2．1系统的结构图1 m眦B系统仿真逻辑实现图 321 2005年中国数字电视与网络发展高峰论坛 China TVCableNetSummit2005 Digital c网络电视与新媒体技术 2．2可以检索的文字的特点在视频流中的文字一般被分为两类：(1)场景文字：文字是视频场景的一部分，它们在视频中的位置是随视频的镜头的改变而改变。(2)视频标题文字：是在视频后期制作过程中加入的文字。其中视频标题文字一般携带着视频内容的重要信息，并且它的内容一般也是经过设计的，位置一般固定。这篇文章提出的新框架方法对这两种文字都可以识别。我们识别的文字必须满足以下的一些特点或前提： (1)这些文字一般是从左到右或者从上到下的矩形区域内部。 (2)一般这些文字的颜色和背景的颜色有一定的对比度。 (3)一般是多余两个文字，这样文字区域的边框一般宽度要大于高度。 (4)文字的边界线一般含有很多的边框为了实验系统的设计，我们采用了中央电视台《新闻联播》和《探索发现》的视频作为实验的材料。 2．3 MATLABR14SP2视频图像处理工具箱的工具箱。它可以快速设计、仿真、构建与验证各种视频和图像的算法与系统。它提供了图形视频处理中的各种基本的算法。设计这个系统时我们采用了视频与图像处理工具箱，并且直接使用SimuLink工具进行设计，如图l 所示：图中每一个矩形框就是一个子系统，可以方便的定制每一个子系统的引脚，设计数据流向与子系统的内部框架的构建。这个工具箱的另一个亮点在于它生成ANSI／ISOC代码后，可以直接用于可以编程的处理器中，如(DSP或者GPP)或者用于更大规模的仿真。 3系统原理与各环节设计针对系统的结构，我们重点讨论其中重点组成部分：文字区域识别与文字区域背景过滤。首先提取视频中的关键帧，然后进行文字区域的识别。我们的方法是基于纹理分析的方法