- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
视音频编解码技术发展现状和展望
视音频编解码技术发展现状和展望(一)
胡瑞敏,刘琼,张勇
摘 要: 随着国内外市场对多媒体应用需求的不断增加,人们对视频、音频服务质量的期望不断提升,视音频编解码技术越来越多的受到重视,并在近十几年里得到了飞速的发展。本文在分别介绍了视音频编解码技术的主要内容和国内外发展现状之后,对视频编解码技术在安防中的应用情况进行分析,并且在最后对视音频编解码技术的发展趋势进行了展望。
关键词:视频编解码技术;音频编解码技术引言
近年来,市场对于视频会议、视频监控、交互电视、智能语音识别等多媒体应用的需求不断增加,并且用户对于多媒体服务质量的期望也越来越高。为了有效防止信号在传输和存储过程中引入噪声和导致波形畸变,获得更好的品质,模拟信号(音频信号、图像和视频信号)一般需要经过采样和数字化,然后再进行存储、传输和重建。但这些数字化信号的信息量极大,尽管海量存储技术、处理器的速度和数字通信系统的性能有了迅猛发展,但对数据的存储能力和数据传输带宽的需求仍然超出了现有技术的能力所及。为了使通信成为可能,并尽可能的降低通信的费用,优秀的信源编解码性能是必需的。因此,视音频编解码技术作为信源编码技术,是多媒体应用技术的基础和核心。本文的第一章和第二章就国内外视音频编解码技术的发展现状进行了详细阐述,继而对国内外的研究现状进行了对比分析。鉴于视频编解码技术在安防应用中属于核心技术之一,本文在第三章分析了这两者之间的关系。最后,第四章对视音频编解码技术的发展趋势进行了展望。
1视频编解码技术发展现状
视频编码的主要目的就是在保证一定重构质量的前提下,以尽量少的比特数来表征视频信息。视频编码的原理是:由于表示图像和视频信息所需的大量的数据往往是高度相关的,这些相关性会引起信息的冗余,因此可以通过去除这些冗余信息来实现对视频数据的压缩。传统的基于统计特性的运动补偿+变换编码的混合编码框架在数据压缩方面取得了很大的成果,国内外的通用视频压缩标准均基于此框架,比如H.26L系列、MPEG系列以及我国的AVS-P2标准。但是随着计算机网络的不断发展和应用需求的多样化,对于视频编码技术的研究不再仅仅局限于压缩特性,而渐渐开始向网络适应性、用户交互性等方面转移。因此,这几年来,视频编码技术一方面继续以混合编码为框架研究如何进一步提高压缩特性,另一方面不断的向可伸缩编码、多视点编码等分支方向发展。
1.1. 混合编码技术
混合编码框架的技术主要包括:运动补偿、预测编码、变换编码以及熵编码等。近年来混合编码的研究主要集中于如何在技术细节方面进行进一步完善,使编码效率得到进一步的提高。
其典型代表为2003年由联合专家组JVT(Joint video team of ISO/IEC MPEG and ITU-T VCEG)制定的新一代视频编码标准H.264/AVC[1]。H.264/AVC 是一种高效的压缩方法,在保持传统的混合编码框架的基础上,主要通过以下技术提高编码效率[2]:
可变尺寸的运动估计(Variable block-size motion compensation)
更精细的1/4象素运动估计(Quarter-sample-accurate motion compensation)
多参考帧运动补偿(Multiple reference picture motion compensation)
空间域的帧内预测(Directional spatial prediction for intra coding)
算术编码(Arithmetic entropy coding)和基于上下文的熵编码(Context-adaptive entropy coding)
率失真优化(Rate-Distortion Optimal)
前4项属于预测编码,第5项属于熵编码,最后一项属于编码决策。文献[3]认为熵编码的编码效率已经接近极限。预测编码如果能采用新的思路,还有一定的发展空间。
国内标准方面,由我国信息产业部数字音视频标准专家组制定的AVS标准视频部分的基本框架也是混合编码技术。AVS对于提高压缩效率方面进行了探索,新提出技术包括:对称双向帧技术、自适应扫描技术、自适应的系数间非均匀量化技术等。这些技术都在不同程度上也提高了视频编码的效率或主观质量。
1.2 可伸缩编码技术
可伸缩技术将视频编解码技术从传统的压缩技术转变为了更多考虑网络适应性和灵活性的编解码框架。2005年2月,JVT将可伸缩性编码(Scalable Video Coding, SVC)作为H.264标准的扩展,并起草了H.264标准的可伸缩性扩展第一草案[4]。可伸缩视频编码因为具有时域、空域和质量等多方面的灵活性,不仅特别适合网络传输,而且应用到视频监控领域中还能满足监控视
文档评论(0)