- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第38 卷 第24 期 计 算 机 工 程 2012 年12 月
Vol.38 No.24 Computer Engineering December 2012
·人工智能及识别技术· 文章编号:1000—3428(2012)24—0161—05 文献标识码:A 中图分类号:TP391
基于多模态特征融合的新闻故事单元分割
1 1,2 1
刘嘉琦 ,封化民 ,闫建鹏
(1. 西安电子科技大学通信工程学院,西安 710071 ;2. 北京电子科技学院,北京 100070)
摘 要:对新闻视频进行结构分析,提出一种基于多模态特征融合的新闻故事单元分割方法。将新闻视频分割成音频流和视频流,选择静
音区间为音频候选点,将镜头边界切变点作为视频候选点,做主持人镜头和主题字幕的探测,挑选主持人镜头为候选区间,并记录主题字
幕的起始位置和结束位置,利用时间轴融合音频候选点、视频候选点、主持人镜头和主题字幕,对新闻视频进行故事单元分割。实验结果
表明,该方法的查全率为83.18%,查准率为83.92%。
关键词:新闻视频;多模态特征;字幕;音频;故事单元分割
News Story Unit Segmentation Based on Multi-modal Feature Fusion
1 1,2 1
LIU Jia-qi , FENG Hua-min , YAN Jian-peng
(1. School of Telecommunication Engineering, Xidian University, Xi’an 710071, China;
2. Beijing Electronic Science and Technology Institution, Beijing 100070, China)
【Abstract 】News story unit segmentation method based on multi-modal feature fusion is proposed in this paper by analyzing news video structure.
News video is divided into audio stream and video stream. Mute intervals are detected as audio candidate points, and the shot segmentations for
news video are detected and shot boundary points are chosen as video candidate points, anchorperson shot and topic caption are detected. Story units
are detected by fusing audio candidate points, video candidate points, anchorperson shot and topic caption based on time axis. Experimental results
show that this method can get 83.18% in recall and 83.92% in precision.
【Key words 】news video; multi-modal feature; caption; audio; story unit segmentation
DOI: 1
您可能关注的文档
- 比较两样本平均数的几种方法和评价.pdf
- 转变经济增长方式_推进陕西科学展17套卷子集合答案(有修行与增加).doc
- 第12章_新型软件开发技术-Web服务及SOA.ppt
- 中间件分类与产品.pdf
- 实验三P、V原语模拟实现.doc
- 03堆栈及队列.ppt
- 第08章 存储过程与触发器.ppt
- 基于结构学习KNN分类算法.pdf
- 第5节选择结构.ppt
- 南京市流动人口职住空间差异性评估.pdf
- 2025年成都市玩偶生产荧光涂鸦互动玩偶开发可行性研究报告.docx
- 2025年成都市海绵生产用于体育馆室外运动场地透水改造可行性研究报告.docx
- 2025年天津市体操鞋企业团建运动应用报告.docx
- 2025年上海市溶洞极限运动(速降)场地开发可行性研究报告.docx
- 2025年上海市涵洞工程施工技术应用可行性研究报告.docx
- 2025年上海市体育场馆设施扎带安全防护可行性研究报告.docx
- 2025年上海市牦牛育肥产业园区建设可行性研究报告.docx
- 2025年旅拍宠物陪伴拍摄项目可行性研究报告.docx
- 2025年上海市进口食品节庆主题快闪店可行性研究报告.docx
- 2025年上海市洗选厂尾矿综合利用产业化可行性研究报告.docx
文档评论(0)