12-新闻类视频结构化要点分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Propagation from Video Score to Sub-Shot Score IS(i, j) related to sub-shot S(i, j) located at the i-th row and j-th column of Memory Matrix similar subshots should have similar interest scores ( denote similarity score) IS(i, j) could be as close to its initial score IS(i, j)0 as possible IS(i, j) should be in [1,5] 实验 实验比较 Comparison results of video summarization. The bin value denotes the proportion of our results which are more preferable than the baseline [10] T. Mei, X-S. Hua, C-Z. Zhu, H-Q. Zhou, and S. Li. Home Video Visual Quality Assessment with Spatiotemporal Factors. IEEE Trans. Circuits and Systems for Video Technology, Vol.17, No.6, 2007. [11] X. Qiu, S. Jiang, Q. Huang, and H. Liu. Spatial-Temporal Video Browsing for Mobile Environment Based on Visual Attention. Proc. ICME, pp.1282-1285, 2009. * 现有新闻类分析系统 CMU的Informedia 浙江大学计算机系多媒体计算组的新闻视频 分析系统 (体育新闻节目结构化 ) CMU的Informedia 概述: CMU的Informdia Digital Library Project 综合了自然语言理解、图像处理、语音识别和视频压缩等技术,从文本、音频和视频几个角度分析视频,进行结构化。它以新闻广播作为结构化的测试样本,得到了很好的结果。 CMU的Informedia 视频新闻的分析处理步骤: (1)将新闻节目转化为MPEG格式,音频和视频作为独立的流分开处理,保留各自的时间标志。 (2)应用Sphinx-Ⅱ语音识别系统去识别音频流中的语言,并把识别结果翻译成文本。 卡内基梅隆大学的李开复最终实现了第一个基于隐马尔科夫模型的大词汇量语音识别系统Sphinx。此后严格来说语音识别技术并没有脱离HMM框架。 CMU的Informedia 视频新闻的分析处理步骤: (3)判断镜头边缘和镜头中的关键帧。其它的视频处理比如人脸的识别和视频字幕识别都可以应用于新闻节目分析。 (4)如果有视频字幕,视频字幕和语音识别对应起来,这样就能够把语音识别得到的文本的时间信息附给字幕。 CMU的Informedia 视频新闻的分析处理步骤: (5)视频新闻流被分割成独立的新闻故事或段落,可以用于检索或者回放。 (6)构造新闻故事的抽象数据,比如新闻总结、镜头的关键帧、新闻主题和新闻梗概。 (7)视频新闻中的视频(图像)流和音频流结合在一起成为索引,用户通过Information Client的界面搜索视频。 CMU的Informedia CMU的Informedia 现有新闻类分析系统 浙江大学计算机系多媒体计算组的新闻视频分析系统 (针对体育新闻节目结构化 ) 体育新闻节目结构化 为了检验算法的有效性,浙江大学计算机系多媒体计算组设计并实现了一个新闻视频分析系统,该系统是在windows2000环境下用visual C++开发的。该系统包括镜头切分、主持人镜头识别和视频内容分析三大部分。其中视频内容分析出的结果是一个一个内容独立的新闻故事。 体育新闻节目结构化 由于针对的是体育新闻,所以系统主要考虑这两种镜头类型: 主持人新闻报道镜头 体育新闻详细报道镜头 体育新闻节目结构化 在新闻节目中,主持人新闻报道画面多是只有一个主持人在介绍,如图。 体育新闻节目结构化 这个系统中,采用双阈值法来检测镜头边缘。该模块以用户提交的一个视频段作为输入,输出结果为检测出的所有镜头单元。 体育新闻节目结构化 该图显示了提交一段视频体育新闻后的镜头分割结果 体育新闻节目结构化 图中上部分是整个视频新闻中相邻帧之间特征变

文档评论(0)

南非的朋友 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档