- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种双层新闻逻辑单元分割框架.pdf
一种双层新闻逻辑单元分割框架
范竟往1翟晓飞2封化民3杨鼎才1方勇2,3
1(燕山大学信息工程学院,秦皇岛,066004)
2(北京邮电大学电信工程学院,北京,100876)
3(北京电子科技学院信息安全与保密重点实验室,北京,100070)
摘要:本文采用一种双层混合模型将新闻视频分割为逻辑故事语义单元序列。谊双层混合
模型是Chaisorn和Chua[2003]等提出的混合模型的扩展,加入了主题标题、主题镜头、人脸
个数和人脸位置等特征以及一个基于内容的相似模捷和基于启发式规则的预分割模块等。谊
系统在镜头层和故事屡分剐采用决策树和隐式马尔可夫算法。经过24个小时(967个故事单
元)的CCTV国际频道的新闻节目对模型进行训练乖18个小时(718个故事单元)的CCTV
和其他新闻节目进行测试,试验表明该系统取得了对CCTV新闻故事单元边界检测达到
81.5%的F·值。
关键词:特征提取;镜头分类;HMM;故事边界检测
1.引言
视频分割和视频分类一直都是多媒体领域的一个热门话题,很多学者在这一领域做了
很多工作。大体上可以分为两大类:镜头的分类和故事单元的检测。在镜头分类方面Zhou
等…利用运动、颜色和边缘特征并采用一种基于规则的方法来对篮球视频进行镜头的分类。
Chen和Wongf”也采用基于规则的方法结合运动、颜色、标题和相角特征将新闻视频划分
为:天气预报、报道、广告、足球和篮球六类。在故事单元检测领域,大多数研究都采用
了HMM的方法来检测边界。Eickeler等人[31从帧间的色彩直方图和运动强度的变化中提取
特征,然后引入HMM将视频序列分为:广播员、报道、天气预报、开始、结束和经过编
辑的场景六类。Chaisorn和Chtla[41等提出了一种混合模型的方法来对新闻视频进行不同层
的分析和处理,该方法虽然较好地利用了分层的处理方式,但并不足以充分地表述新闻视
频的模式。
经过大量的观察统计分析,我们发现在新闻视频中存在主题标题和主题镜头这种特
征,于是我们对双层混合模型【41进行了扩展,对原框架中加入了主题标题、主题镜头特征
以及基于启发式规则的预分割模块。同时为了提高主持人镜头的识别率进而提高整个系
统性能,我们提取了人脸大小和人脸位置两个特征并加入一个基于相似性的匹配算法(这
里我们称为语义相似模块)对决策树进行校正,因此我们的系统是一种改进的新型新闻
视频分割框架。
资助项目:国家自然科学基金项目【项目号t
corn
联系作者:范竟往.硕上,E-mail:fartjingwang@163
76 第一部分第十四届全国多媒体技术学术会议
2.改进的新闻视频逻辑单元分割框架
2.1新闻视频的逻辑结构
新闻视频在结构上具有一定规律性,一段新闻节目都是以一些内容提要镜头开始,然
后报道一个个故事,最后大多以天气预报结束,在播报中往往还会穿插一些广告。如图1
所示。
图1新闻视频逻辑结构
在这种结构中,我们把具有特定模式标题的镜头称作主题镜头(如图1中Title)。这些
标题一般出现在屏幕下方,具有一定轮廓和颜色,说明一段故事的主题。由于主题镜头的
存在,新闻中的故事单元不仅仅是以主持人镜头(Anchor)作为开始和结束,主题镜头也
是一种开始和结束的标志。比如播报简讯时(如图1中图片),就是以主持人镜头开始,后
接几个分别以主题镜头开始的新故事单元。
基于这种复杂的新闻视频模式,我4fJg『入隐式马尔可夫模型,通过加入主题特征以期
对新闻视频序列进行更加充分地表述。
2.2整体框架
考虑到HMM特别适合于动态离散量序列,我们采用了类似文献『41中的双层混合模型
的框架并作了扩展。整个系统的框架如图2所示。
其中: AC.音频分类,sD一镜头持续,Fs.人脸大小,MA.运动强度,TC,主题捕捉,CT一多行文本,FP.^脸位置AF一
音频特征,FN.^脸个数
图2系统框架
首先我们采用ⅢM的“VideoAnnEx”将新闻视频分割为一个个镜头,对每个镜头的音
一 !童堡堡里
您可能关注的文档
- 一氧化碳分析仪在氧化铝焙烧生产中的应用.pdf
- 一氯三嗪β环糊精接枝真丝的研究.pdf
- 一汽集团企业竞争情报系统的研究与开发.pdf
- 一浴法连续前处理清洁生产工艺.pdf
- 一特种结构分析方法的演进及其方法论启示.pdf
- 一生之水香水的香气成分分析.pdf
- 一硼化物和二硼化物超导体电子结构研究.pdf
- 一种18脉冲整流器用的新型自耦变压器分析.pdf
- 一种200kV气体火花开关动态特性的研究.pdf
- 一种3um+P阱CMOS兼容纵向PNP晶体管β的研究.pdf
- 职业学院扩建项目商业计划书.docx
- 2025-2026学年小学英语辽师大版一起一年级上册-辽师大版(一起)(2003)教学设计合集.docx
- 2025年江苏南京市溧水区教育局所属事业单位招聘教师74人笔试模拟试题及完整答案详解1套.docx
- 医院卫生应急预案演练脚本.docx
- 医院综合提升项目经济效益和社会效益分析报告.docx
- 职业学院扩建项目投资计划书.docx
- 博物院建设项目环境影响报告书.docx
- 2025-2026学年小学英语六年级上册北京版(2024)教学设计合集.docx
- 2025年江苏南京市溧水区人民检察院招聘编外人员2人笔试模拟试题参考答案详解.docx
- 职业学院扩建项目初步设计.docx
文档评论(0)