视音频编解码技术发展现状和展望解析.docVIP

视音频编解码技术发展现状和展望解析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视音频编解码技术发展现状和展望 摘 要: 随着国内外市场对多媒体应用需求的不断增加,人们对视频、音频服务质量的期望不断提升,视音频编解码技术越来越多的受到重视,并在近十几年里得到了飞速的发展。本文在分别介绍了视音频编解码技术的主要内容和国内外发展现状之后,对视频编解码技术在安防中的应用情况进行分析,并且在最后对视音频编解码技术的发展趋势进行了展望。 关键词:视频编解码技术;音频编解码技术 引言 近年来,市场对于视频会议语音识别Joint video team of ISO/IEC MPEG and ITU-T VCEG)制定的新一代视频编码标准H.264/AVC[1]。H.264/AVC 是一种高效的压缩方法,在保持传统的混合编码框架的基础上,主要通过以下技术提高编码效率[2]: 可变尺寸的运动估计(Variable block-size motion compensation) 更精细的1/4象素运动估计(Quarter-sample-accurate motion compensation) 多参考帧运动补偿(Multiple reference picture motion compensation) 空间域的帧内预测(Directional spatial prediction for intra coding) 算术编码(Arithmetic entropy coding)和基于上下文的熵编码(Context-adaptive entropy coding) 率失真优化(Rate-Distortion Optimal) 前4项属于预测编码,第5项属于熵编码,最后一项属于编码决策。文献[3]认为熵编码的编码效率已经接近极限。预测编码如果能采用新的思路,还有一定的发展空间。 国内标准方面,由我国信息产业部数字音视频标准专家组制定的AVS标准视频部分的基本框架也是混合编码技术。AVS对于提高压缩效率方面进行了探索,新提出技术包括:对称双向帧技术、自适应扫描技术、自适应的系数间非均匀量化技术等。这些技术都在不同程度上也提高了视频编码的效率或主观质量。 1.2 可伸缩编码技术 可伸缩技术将视频编解码技术从传统的压缩技术转变为了更多考虑网络适应性和灵活性的编解码框架。2005年2月,JVT将可伸缩性编码(Scalable Video Coding, SVC)作为H.264标准的扩展,并起草了H.264标准的可伸缩性扩展第一草案[4]。可伸缩视频编码因为具有时域、空域和质量等多方面的灵活性,不仅特别适合网络传输,而且应用到视频监控领域中还能满足监控视频资料的存储、检索、分析等方面的种种特殊需求。近两年来,可伸缩技术在视频监控中的研究已广泛展开[5-9],而且在SVC的需求文档中已将视频监控列为可伸缩视频编码技术的主要应用领域之一。所以可伸缩视频编解码技术不仅是JVT组织中的当前热点研究问题,更是视频监控技术中的研究热点问题。 到目前为止,实现可伸缩技术的方法大致上可以划分为两种:基于小波变换的可伸缩技术和基于传统的混合编码结构的可伸缩技术。 1.2.1基于小波编码的可伸缩技术方案 基于小波的视频编码[10]是指以离散小波变换(DWT)为核心的视频编码方案。由于三维小波编码方案没有形成国际标准,所以三维小波编码呈现争鸣的局面。在这些提交方案中,根据压缩处理流程的不同,可以被分为以下四大类: 纯三维小波方案 纯三维小波的视频编码方案[11]是在原二维平面小波基础上的直接过渡的,该方案将视频压缩看作是三维图像的信号处理,将其按三维立体空间的正交小波基展开。该方案的三维小波滤波函数具有对称性好、支集小的特点,帧内、帧间小波系数具有统一性,保证了时间维的衰减速度。但该方案不采用运动补偿机制,因此对时间维的长度要求比较苛刻,过短的时间维数据将使压缩效果大大下降;而过长的时间维数据又会影响压缩的实时性和内存需求。 小波框架的运动补偿方案 小波框架的运动补偿方案是DCT 框架的运动补偿方案的推广,该方案用DWT 替换原有的DCT,而其它的处理流程均继承于原DCT方案。该方案有DCT 编码体系和技术的支持,压缩性能比较好。但该方案沿用了原DCT的块结构处理的模式,空间可伸缩性会受到影响,还会产生差错传递和块效应。 小波子带预测方案 小波子带预测方案首先对每一帧图像进行二维空间小波变换,然后再对所得的各子带小波系数值进行帧间预测去处冗余,最后对生成的数据进行熵编码。整个处理流程是分子带进行的,子带与子带之间互不影响。 该方案的运动预测是在不同的小波子带中进行的,因此不会产生整幅图像的差错传递,这种差错只会在各个子带中传递。但该方案编码是一帧一帧分开处理的,所以时间可伸缩性的发挥相对有限。该方案还将整个编码过程形成一个闭回路,参考子带是基于解码重构而成

文档评论(0)

四娘 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档