【软件学报】一种用于电视新闻节目的播音员镜头检测算法.pdf

【软件学报】一种用于电视新闻节目的播音员镜头检测算法.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1000-9825/2002/13(08)1559-09 ©2002 Journal of Software 软 件 学 报 Vol.13, No.8 一种用于电视新闻节目的播音员镜头检测算法· 杨 娜, 罗航哉, 薛向阳 (复旦大学 计算机科学与工程系,上海 200433) E-mail: xyxue@ 摘要: 提出一种播音员镜头自动检测算法.利用播音员镜头频繁出现的统计规律,基于自动聚类方法找出候选 播音员镜头, 然后根据播音员镜头出现的时空特征, 用神经网络分类器对候选播音员镜头进行确认,从而实现对 播音员镜头的检测.该算法是自动分析电视新闻节目内容的重要手段之一,对建立视频数据库索引是必不可少 的.实验结果表明,该方法具有准确、快速的特点,可有效地应用于视频检索系统. 关 键 词: 视频信息检索;多媒体数据库;视频内容分析;播音员镜头检测;视频数据库索引 中图法分类号: TP391 文献标识码: A 近年来, 随着存储成本的降低、传输速率的提高以及高效数据压缩技术的发展, 因特网上视频信息大量涌 现,人们访问并利用视频信息的需求日益增长.视频信息内容丰富、信息量大,如何对海量视频信息进行有效的 索引、浏览和检索已成为当前信息检索领域非常重要的研究课题. 一般认为,视频内容可以表示成从低到高的4 个层次, 即关键帧-镜头-场景-视频.镜头是由一个摄像机从打 开到关闭过程中拍摄的一串连续的帧序列.关键帧是从一个镜头中选取的具有代表性的图像帧.场景是表达同 [1,2] 一语义信息的连续镜头序列,它是视频信息的最小语义单位. 目前人们对镜头分割和关键帧提取 的研究已较 成熟. 由于镜头不能表达完整的语义, 因此人们致力于视频语义自动分析的研究,并且已开发出一些原型系统. [3] 例如,美国MITRE 公司信息系统研究中心开发的新闻节目导航系统 .不过, 目前系统在准确性和实时性上远远 不能满足实际需求,原因在于快速、准确地进行视频语义 New shots① 分析是一个难题. 现实世界中, 视频节目类型多种多样, 常见的有电 影、新闻、体育、商业广告节目等,它们均具有各自的特 点.例如,新闻节目的结构在时间序列上较为固定,通常播 音员镜头和新闻故事单元交替出现.图 1 给出了上海电 Anchorperson shots② 视台新闻节目的一个例子. 由于新闻故事内容多样,缺乏 t 结构性,利用本身的镜头信息难以识别;而播音员镜头往 ①新闻故事单元,②播音员镜头. 往内容变化不大,运动较小,用一定的方法可以实现较准 Fig.1 The temporal structure of news program 确的识别.播音员镜头可以作为新闻场景分割的边界,因 图1 新闻节目的结构 此,对播音员镜头的检测成为新闻节目内容分析的重要手段之一. 在文献[4]提出的新闻内容自动分析和索引系统中,采用模板匹配的方法实现播音员镜头检测,分3 个步骤: · 收稿日期: 2001-09- 15; 修改日期: 2002-03- 15 基金项目: 国家自然科学基金资助项目69935010); 国家高技术研究发展计划资助项目(2001AA114120);上海市科 技启明星计划资助项目(01QD14013);上海市科技发展基金项目(015115044) 作者简介: 杨娜(1978女,河北辛集人,硕士生,主要研究领域为视频信息检索研究;罗航哉(1977男, 四川泸县人,助教,主要 研究领域为视频信息检索;薛向阳(

文档评论(0)

hshh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档