- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于内容视频检索技术教学应用研究
基于内容视频检索技术教学应用研究
【摘要】首先指出了传统视频检索的局限和不足,阐述了基于内容的视频检索过程;以视频教材为结合点,总结了基于内容的视频检索技术在教学中应用的思想和方法,思考了该技术对视频教材开发的启示;并针对提高视频教材交互性的问题,提出了自己的观点。
【关键词】基于内容的视频检索;视频教材;交互性;关键帧;学生支持服务
【中图分类号】G431 【文献标识码】A 【论文编号】1009―8097 (2008) 07―0101―03
一 引 言
随着多媒体、网络和计算机技术的发展,特别是海量存储技术和流媒体传输技术的成熟和完善,数字视频已经成为教育教学中重要的资源类型。如何快速有效的检索视频资源,如何提高视频教材的交互性,成为其能否在教育教学中充分利用的关键因素。
数字环境下,传统的电视教材经过数字化编码以后,可以通过???络传播,利用计算机硬盘、光盘存储,通过计算机播放呈现内容,已经突破了以往仅通过电视传播和呈现的单一方式。因此,传统电视教材的概念已经不能完全涵盖数字环境下电视教材的内涵。基于此,本文把数字环境下的电视教材称作视频教材。
视频信息通常包括两部分:一部分是底层的视觉信息,如:颜色、纹理、主体形状和运动特征等;另一部分是高层的语义信息。视频数据本身只能表达视觉信息,而不能表达其语义信息,因此视频的语义信息具有多样性和模糊性,不同的人对同一段视频可能会有不同的解释,加上视频信息数据量大、数据结构复杂, 这就决定了对视频的检索要更复杂、更困难。视频检索就是从大量的视频数据中找到所需的视频片段。传统的视频检索基于关键词描述(Keyword-based Video Retrieval,KBVR),其描述能力有限、主观性强、需要手工标注,视频数据库建设成本高、周期长,检索的单位只局限于电影或整场比赛,对于更小的视频片段,如一个场景或镜头的检索,只能依靠传统的快进、快退等手段进行人工查找。费时、费力且不能满足用户对视频内容检索的要求[1]。基于内容的视频检索既能向用户提供基于颜色、纹理、形状及运动特征等视觉信息的检索,又能提供基于高级语义信息的检索,具有在镜头、场景、情节等不同层次上进行检索的功能,能满足用户基于例子和特征描述的检索要求。
二 基于内容的视频检索过程分析
镜头是视频数据的基本单元,所以基于内容检索的视频处理,首先必须将视频序列分割为镜头,再对每个镜头进行特征提取,得到一个尽可能反映镜头内容的特征空间,作为镜头聚合的依据。镜头特征包括静态视觉特征和动态特征两个方面。静态特征主要指颜色、纹理及主体形状特征等。静态特征的提取是通过对镜头关键帧特征提取实现的。关键帧是从镜头中抽取出来的,能反映镜头内容的一组静态图像。动态特征的提取是在对镜头运动分析的基础上进行的,运动分析主要是针对目标运动轨迹的变化、目标大小的变化、镜头运动的变化(如:推、拉、摇、移、跟等),所采用的方法主要有基于块的方法、像素递归方法、贝叶斯方法和基于光流方程的方法等。所提取的特征被存入特征库中,并以此进行索引。在镜头的基础上,根据镜头特征进一步进行镜头聚类,形成情节,然后提取情节的代表帧 ,并进行描述后存入视频数据库。最后根据用户提交的查询按照一定的特征进行视频检索 ,将检索结果按相似程度提交给用户,这样用户就可以方便的浏览和检索视频。基于内容的视频分析如图1所示[2]。
基于内容的视频信息检索系统一般由索引、查询、检索三大模块组成。索引模块中,运用镜头分割、关键帧选取、特征提取等技术对视频数据进行预处理, 并实现视频特征索引的建立;查询模块是实现人机交互的重要接口, 通过该模块用户可以容易地实现交互信息查询, 即方便地向系统提交自己的各项特征要求,并可把检索结果作为进一步查询的输入,实现更精确的检索;检索模块主要完成视频特征索引与用户提交的各项特征的相似度计算、特征匹配,并根据相关度进行结果排序后提交给用户。基于内容的视频检索系统整体模块图如图2所示[3]。
基于内容的视频检索的关键技术主要有镜头检测技术、镜头聚类技术、视频数据库组织和索引技术、视频语义分析技术以及显示和交互技术等。
三 教育教学应用
在教育教学方面,基于内容的视频检索技术主要是用来对视频教学资源进行有效的检索和管理,比如:灵活获得所需视频教学资源,学校图书馆的数字化,远程视频教学等方面。文章主要以视频教材为结合点来研究基于内容的视频检索技术在教育教学中的应用。
1 视频教材交互性研究
受传统教育的影响,我国的学习者特别钟情于视频教材。但由于传统电视教材大都以整节课为单位开发的,具有整体性、封闭性等特点,因此几乎不具备交互
文档评论(0)