一种基于聚类的主持人镜头检测算法.pdfVIP

下载本文档

2
0
约1.26万字
约 5页
2018-08-19 发布于天津
举报
版权申诉

一种基于聚类的主持人镜头检测算法.pdf

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种基于聚类的主持人镜头检测算法

电子发烧友电子技术论坛一种基于聚类的主持人镜头检测算法摘要：随着数字视频的广泛应用，视频数据库系统已成为基于内容的视频检索领域的一个研究热点。在建立视频数据库的过程中，主持人镜头的检测是一个重要而又难以解决的问题。本文先在镜头级别对视频提取一系列的时域和空域特征，如人脸特征，彩色纹理特征，镜头时间长度等。然后综合采用决策树和聚类分析方法对镜头分类，判断镜头中是否有主持人，从而实现主持人镜头的检测。实验表明，采用本文提出的算法，准确率可达 98.7% ，同时查全率为 95.2%，较好的解决了这一问题。关键词：视频检索；聚类分析；主持人镜头的检测中图分类号：TP391.4 文献标识码：A A clustering-based approach to anchor shot detection for news video Abstract: With the wide application of digital video, video database library has been an important direct of content based video retrieval. In the field of video database research, the detection of anchor shot is an important problem hard to solve. The video is analyzed at the shot level using a variety of features in the Spatial and Time Domain. Then we employ Decision Trees and clustering technique to classify the shot into anchor shot or unanchored shot. The experiment indicated that we can achieve a high precision of 98.7%, while the recall was up to 92.9%. Key words: Video retrieval, clustering, detection of anchor shot 引言多媒体和视频压缩技术的发展和广泛应用使得视频信息呈指数级增长，视频数据库的建立对视频信息的分类、管理和检索至关重要。由于新闻视频包含了大量的信息，在视频检索中被检索率极高，因此如何建立一个高效的新闻视频数据库成为信息领域的一个研究热点。建立新闻视频数据库的一个关键问题是如何将新闻视频按事件（story ）进行分割，从而标注一个个独立的新闻或事件，易于检索、分类和分析。由于新闻事件分割的重要性和复杂性，在 TRECVID （TREC Video Retrieval Evaluation ）1 中,每年都会有新闻事件分割（news story segmentation ）准确度的评测[1]。新闻视频中的主持人镜头，即含有“主持人帧”的镜头，是新闻场景的重要结构特征，它的出现往往表示新闻故事的结束和开始。因此，主持人镜头的检测成为对新闻视频进行事件分割的主要方法。近年来中外学者针对这一问题做了大量的研究与探索。M. De Santo 等人 [2] 利用了主持人镜头在一段时间内反复出现和时间较长的特点，建立了三个决策树分类器组成一个多专家系统，来实现主持人的检测。几年后，他们[3]又加入了针对音频特征的分类器来改善检测的效果，但由于音频检测的精度较差，所以整个系统检测效果改善不大。Lekha Chaisorn 等人[4]利用主持人镜头中存在人脸特点，通过检测人脸的数目，镜头时间长度等特征建立决策树来实现主持人镜头的检测。这种算法的优点在于对于数据中的噪音有很强的鲁棒性，但很难区分会议镜头与主持人镜头。论文[5] 利用主持人镜头内运动变化较小，时间较长的特点，获取候选的主持人镜头，然后根据主持人反复出现的特点，检测出主持人镜头。如上所述，虽然国内外针对这一问题已做了大量的研究，也取得了一定的成果，但仍然存在较大的问题。本