基于特征的视频分割与内容总结-软件工程专业论文.docxVIP

下载本文档

2
0
约6.71万字
约 53页
2018-05-05 发布于上海
举报
版权申诉

基于特征的视频分割与内容总结-软件工程专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于特征的视频分割与内容总结-软件工程专业论文

摘要随着大数据时代到来，数字媒体及其相关的领域正在发生革命性的变化，为数字图像处理技术带来许多新的挑战。本文主要关注的问题可概括为：? 如何将大量低层次的视觉特征有效融合，进而形成对图像、视频内容在语义层面的理解，满足人们高效地分类存储及检索图像、视频的需求；? 如何充分利用海量无标注数据，并对大量冗余的视觉特征进行有效特征选择，剔除不相关特征，减少存储空间并提高分类准确率；? 如何自然概括地诠释长视频内容，以供人们快速浏览，从而从另一个角度解决语义鸿沟的问题。本文从以下三个方面尝试解决上述问题：首先，本文提出了一种基于高阶条件随机场的自适应特征融合方法，对视频进行语义层面的运动目标分割。该方法优化了传统视频分割问题中多种视觉特征无法动态自适应融合的问题，对视频分割给出了更通用、准确率更高的解决方案。其次，在存在着大量无标注数据的前提下，本文提出了一种半监督的特征选择方法，该方法采用嵌入式特征选择，将基于 ?2,1 范数的稀疏项与半监督学习相结合。在大规模真实网络图像上的分类实验证明了该方法能够在仅有少量标注信息的限制下得到较高的分类准确率。第三，在上述实验过程中以及对大量已有工作的总结中，发现语义鸿沟不可避免的产生，因而本文在对低层次特征的理解上，提出一种基于一类支持向量机的视频总结方法，产生代表性广、震撼力强，且可连续播放的视频总结方案，并使自动生成能够引起人们观影兴趣的电影宣传片成为了可能。综上，本文从上述三个角度，充分融合并利用了各种低层次视觉特征，尝试解决图像、视频检索中的语义鸿沟问题，并给出了多种解决方案，在真实图像、视频数据集上对算法进行了验证，证明了我们提出的方法的可行性、有效性。关键词：视频分割，图像特征选择，视频总结，图像处理，半监督特征选择 ABSTRACT ABSTRACTIn the era of “big data”, revolutionary changes are taking place in digital media and related academic areas, bringing many new challenges for digital image processing. In this thesis, we focus on three major problems:How to e?ectively and e?ciently fuse multiple low-level features, in order to gen-erate semantic understanding of images and videos for e?cient storage and index;How to take advantages of large-scale unlabeled data and benefit feature selection for big and redundant visual features, hence removing unrelated features, reducing storage space, and improving classifiers’ accuracy;How to naturally summarize long videos for quick skimming which tries to solve“semantic gap” from another perspective.We will try to solve the above problem with the following steps:Firstly, we propose a video segmentation method via adaptive higher-order CRF with windowed dynamics, which is a general and e?ective resolution for moving object segmen- tation.Secondly, we propose a semi-supervised feature selection method for web image clas- si cation, which takes advantages of both ?2,1-norm based em