- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
南京人学100I:论文 第一章 引言
术,利用视频OCR技术抽取视频中的文字建立索引是一项很有意义的工作,它可
以使广大学生迅速准确地定位感兴趣的视频资源部分,更好地使用远程教学资源。
木文利用基于内容的视频检索及视频OCR技术,分析和设计了一个面向远程
教学的基于自动字幕抽取的教学视频检索系统。这方面的研究是很有意义的,作
为 《网络教学支持系统》中的一个子课题,它为教学提供了便捷的信息服务,促
进了远程教学的普及和发展。
1.3 现有的相关工作
数字视频的索引和检索是近年来的热门研究领域,目前己有许多研究工作。
自动视频索引一般使用基于对象或整个图像的颜色、纹理、轮廓、运动以及伴音
等信息进行。而自动检测、抽取、识别出现在数字视频中的文字,并将其用作索
J}来检索视频则是Lienhart等L[-1-198]新近提出的。
最初的文字识别的工作集中在印刷体和手写体文档的OCR识别,以满足办公
自动化系统对文档阅读器的大量需求和市场。这些系统己经达到很高的成熟度。
其后文字识别工作被用于工业应用上,但大都集中于特定的应用领域,例如车牌
识别、工程图纸识别、地图文字识别等。它们适用的背景和文字都是受限制的。
己有一些工作研究在复杂图像和视频中的文字检测与抽取。Smith和
Kanade[S.im98]简要地提出了一种在视频帧中检测和抽取文字的方法,这种方法把文
字特征化为 “聚类锐边的水平矩形结构”并应用这种特征鉴别文字片段。这种方
法完全是帧内的。
Ye。和Lin[v`0961提出了一种标题文字检测与抽取的策略,它是基于视频中局部
区域的切变和渐变的镜头边界检测技术的。标题文字的出现和消失被定义为局部
切变或隐现。这种方法是针对MPEG视频的,是基于帧间的方法,计算简单。然
而,标题文字只是出现在视频中的文字的子集,且当遇到不符合分类标准的情况
时 (例如滚动标题),这种方法就失效。
Zhong等Z[hong951提出了一种在复杂图像中定位文字的简单方法。他们混合使用
两个方法,一是基于寻找一定尺寸的单色连通区域,二是基于文字的特定空间变
化。但这种方法用于在扫描的彩色CD图像中定位文字,并未直接用于视频帧。
Wu等JW.971提出了一个四步骤系统,以在图像中自动检测和抽取文字。首先,
应用纹理分割来检测文字可能出现的区域。其次,从分割的文字区域中抽取文字。
对文字串使用高度相似性、间隔和排列成的行列等合理的启发性机制,然后处理
抽取的文字以形成包含相应文字串的矩形框。再次,通过清除背景和二值化检测
的文字串来抽取文字。最后,把文字提取出并二值化,通过商用的OCR软件识别。
南京大学倾 卜论文 第一章 引言
这种方法是针对扫描的图像处理的,也不能直接应用十视频帧。
Ohya等o[hyn941对场景图像中的文字识别进行了研究。场景中的文字存在于二
维空间,可能被旋转、倾斜或部分遮挡。Ohya等把文字限制为垂直、单色、非连
通的,以便于检测。但他们的研究局限于静态图像而非视频帧。
Sat。等[Sat.99]提出了在低分辨率文字和复杂背景情况下,处理新闻视频中文字
的识别方法。通过使用亚像素插入方法来放大文字图像,以提高文字分辨率,采
用多帧集成的方法来去除复杂背景。同时也提出了一个文字抽取滤波器和一种文
字识别的新方法。但他们的许多方法只适用于新闻视频。
Lienhart等L[knh.98)提出了一种面向视频检索的自动文字检测与识别的新方
法。他们利用视频中文字的典型特性,通过颜色分割、对比度分割、几何分析、
纹理分析、运动分析等步骤,把文字集成为一个二值图像,并通过标准OCR软件
把分割的文字转换为ASCII码形式,同时介绍了简单的索引和检索策略。但他们
的方法主要针对电影视频的片头或片尾字幕的。
HuipingLi等L[i99.)也对视频中的文字检测与识别进行了大量的研究工作。他们
提出的方法主要是基于神经网络的。他们的系统实现了一个规格空间特征抽取器,
以馈给人丁神经处理器来抽取文字区域并追踪它们的运动。抽取的区域通过 OCR
系统产生可用于索引的关键字。
1.4 本文的内容与组织
木文的研究 「作主要针对教学视频,主要研究面向教学视频检索的自动字幕
检测、抽取与识别技术。木文研究工作的
您可能关注的文档
- 1、2型星型胶质细胞的分离纯化培养及其生物学特性研究.pdf
- 1、PC12细胞中糖皮质激素快速激活丝裂原激活的蛋白激酶的信号传导通路2、雌二醇对原代培养的大鼠海马MAPKs的快速激活.pdf
- 1苯甲酰基3芳基咪浴类衍生物的合成.pdf
- AT切石英晶体谐振器的理论研究.pdf
- AVM栓塞剂NBCA混悬液配比问题的基础和临床研究.pdf
- BCL2蛋白在增生性肾炎与非增生性肾炎中表达及意义的研究.pdf
- CD81LDLR单核苷酸多态性与丙型肝炎病毒.pdf
- ckitR在急性白血病中的表达及其临床意义研究.pdf
- cmyc和16p在子宫内膜癌中的表达及临床意义的研究.pdf
- EGFR、Bax、Rb在高能电子线大鼠皮肤辐射损伤模型中的表达与意义.pdf
原创力文档


文档评论(0)