基于视觉特的视频编码理论与方法研究毕业专业论文.docVIP

下载本文档

5
0
约3.42万字
约 45页
2017-03-20 发布于上海
举报
版权申诉

基于视觉特的视频编码理论与方法研究毕业专业论文.doc

1、本文档共45页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

项目名称：基于视觉特性的视频编码理论与方法研究视频编码技术已经成为数字视频广播(广播网)、数字媒体存储与网络传输(计算机网络)、以及多媒体通讯(通信网)等数字媒体产业的共性关键技术。特别是近年来，我国的数字媒体产业迅猛发展，年均产值已近万亿元，使得音视频编解码标准的。经过多年努力，中国终于有了自己的视频编码国家标准AVS。但我们仍需未雨绸缪，从模型、理论、方法和技术上视频编码国际标准的制定早做准备，确保在下一轮的标准竞争中立于不败之地。从编码角度看，编码的主要是在高质量视觉效果降低码率。众所周知，人类视觉系统的信息处理能力远远超过目前的视频处理系统，因此，从方法论上借鉴人类视觉系统的视觉信息处理基本神经机制和心理机理，构建统一的图像/视频基本结构与表示模型及其相应的视觉计算方法，高效视觉信息编码理论与方法，就成为了本项目的基本出发点和立项依据。视频编码的要对视频中包含的视觉信息进行高效的表达和准确的重建，其本质是视觉信息的基本结构和有效表示问题为此，我们需要探讨以下关键科学问题：视觉信息处理机理是什么？作为长期进化的结果，人类视觉信息处理系统是至为精致的生物系统之一。但遗憾的是，其基本神经机制、知觉和认知机理目前尚不清晰。本项目将从多学科交叉的角度出发，视觉信息处理的基本神经机制和认知机理，相应的理论和模型，对其进行实验验证与计算仿真以期能够用以指导建立更加有效的视觉计算模型。符合视觉信息处理机理的计算模型是什么？尽管人类视觉系统的信息处理机理尚不完全明了，但随着技术手段的提高，脑科学、神经科学和认知心理学专家已经掌握了越来越多的规律并提出了很多假说和模型。如何基于这些发现构建相应的、可计算的视觉信息处理数学模型就成为一个重要的基础科学问题。其解决不仅可以有效促进视觉编码技术的发展，还可以从计算模拟的角度反过来推动视觉基本机理的研究。视频表示及编码的是什么？香农信息论虽然从理论上给出了编码效率的上界和失真的关系，但并未考虑编码的符号(事件)集，因而对视频中高阶相关缺乏有效的描述手段。视觉信息论试图借鉴神经生理学在不同感知阶段对感知对象的抽象，建立对应的符号(事件)集，使之能够方便地描述高阶相关性，体现语义结构，从而丰富信息论理论。符号(事件)是借鉴稀疏编码理论通过采用计算视觉感知的后验概率建立的。这将为高效视频编码提供指导性的理论基础。上述三个关键科学问题紧紧围绕视觉信息处理系统中最核心的表示与编码问题，分别从生理/心理基本机理、视觉信息处理计算模型、视频编码基础理论三个层面展开。其中，视觉基本机理既是基本出发点也是落脚点，计算模型是桥梁和纽带，视觉信息论则是设计和实现下一代视频编码方法和技术的理论基础。围绕上述三个关键科学问题，我们提出的总体研究内容框架如图2所示，以期建立解决这些问题的模型、理论和方法，构建相应的验证平台和原型系统。如图所示，对应三个关键科学问题，本项目的主要研究内容自底向上分别建立在三个层面，即：机理与模型层，理论与方法层，关键技术与验证层。下面我们分别从这三个层面对本项目的主要研究内容进行阐述。视觉基本机理与模型层该层面的研究内容面向的科学问题主要是前两个：视觉信息处理的基本机理和符合这些基本机理的计算模型。不难理解，二者有天然的紧密联系：一方面，视觉信息处理基本机理为视觉信息处理的计算仿真、计算模型建立等提供了良好的生理学和心理学参照系，对其基本规律的认识为计算模型的建立提供了良好的技术可能性和努力方向。另一方面，计算模型也为基本机理的正确性和模型的有效性提供了验证机会，有利于推动视觉基本机理的研究。下面分别叙述本项目在视觉基本机理和计算模型方面拟开展的研究。视觉信息处理基本机理研究在视知觉机理方面，将主要从生理、心理角度，通过神经电生理学、视觉行为学、药物学等研究手段，在灵长类动物上采用包括微电极矩阵记录方法、高时间分辨率的事件相关电位(ERP)、功能核磁共振(fMRI)等技术手段从初级视觉皮层V1神经元群体反应特性入手，研究V1神经元经典和非经典感受野与上级视觉皮层区域神经元正向和反向联系、V1神经元之间的横向联系，以及视觉学习过程中神经元群视觉编码模式的变化特性，探索初级和高级皮层中的神经元群在视觉处理中对简单和复杂视觉刺激的编码模式以及动态反应模式，各级皮层神经元群对不同视觉模式识别的贡献，考察视觉注意和知觉组织之间相互影响和交互作用，以验证或改进现有假说或理论模型(如稀疏编码、群组编码、视觉注意、增量成组假说等)，乃至提出有关视觉模式识别的神经机制及编码机理的新假说、新模型，为后续的计算模型的研究提供神经机制和心理机理方面的基础。图3给出了本项目在视知觉基本机理方面拟开展的主要研究内容，涉及的主要关键问题，机理模型/假说，以及拟采用的技术手段。视知