一种可在解压前直接图象处理的视频编码方法的研究与实验.pdfVIP

下载本文档

4
0
约6.45千字
约 6页
2017-08-14 发布于安徽
举报
版权申诉

一种可在解压前直接图象处理的视频编码方法的研究与实验.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种可在解压前直接图象处理的视频编码方法的研究和实验+ 张颍张兆扬钟功铫上海大学通信与信息工程学院邮编200072电【摘要】本文提出了一种可在压缩域上直接图象处理的视频编码方法，不仅可以消除经典编码方法所造成的块状效应、蚊式噪声；而且可将图象处理转化为模型参数上的简洁运算，从而可在解压前直接进行图象处理。 1引言到广泛的应用。但当低比特率编码时，其固有的块状效应、蚊式噪声等缺陷显得更为严重”1。且当传输这种经典方法的编码数据时，若用户需进行诸如图象增强、特征提取、图形图象的变换处理以及虚拟现实等图象处理时，只能将网上接收的压缩数据先解压后方可再进行。如此即增加了编解码次数使重建的图象质量恶化，又增加了时间的开销，增加了成本和费用。本研究组近几年致力于研究甚低比特率编码新方法(VLBC)，其中“基于边缘的模型基法”已得到较好的结果“1，不仅可以从根本上消除上述经典编码方法的缺陷，而且由于此种编码方法可将图象处理转化为模型参数上的简洁运算，从而可在压缩域直接进行图象处理。这比在复原图象上进行同样视觉效果的运算要快速有效得多。下一节简要阐述基于边缘的模型基编码的基本原理。以此为基础，在第三节中探讨在压缩域上直接进行图象处理的基本方法，第四节是结论和展望。 2基于边缘的模型基编码采用基于边缘信息的模型编码的基本思想是：将图象分解成激励区与缓变区。激励区是图象中能够充分反映物体的结构和运动变化等重要信息的区域(边缘所在的图象区域)；缓变区是指图象中灰度值变化不大，人眼～般不甚敏感的部分(没有边缘结构的图象区域)。分别用不同的规范多项式参数描述进行帧内编码，并且利用基于模型匹配的广义运动帧间分析检出运动参数，实现帧间编码。 2．1激励区的提取与表达 l边素的提取在本方法中．由于边缘信息是整个信源模型建立的基础，边缘的提取必须可靠、精确。可分成三个步骤：首先对图象进行中值滤波及灰度均衡以滤除噪声和适应人眼的视觉特性；然后选用一种性能优良的边缘检测技术得到边素的初始分布。最后对初始边素分布采用马尔 ·国家自然科学基金资助项目．24．可夫随机场求后验均值的方法提高边缘的定位精度和抗噪性能。 2激励区的提取 3激励区的表达图l激励区的矩形表达区域对于提取的每一个激励区，用如下的规范三阶多项式来拟合该区域内的灰度空间分布：，=aD3+bD+c (1) 式中，D是激励区内某象素点到结构线段的距离，口、b，c为激励区的拟合参数。通过求一个三元线性超定方程组的最小二乘解可以得到这些参数，加上结构线段首尾端点坐标《zl，YIJ和(X2，Y2)构成的位置参数，就将矩形激励区记录下来了。 2．2缓变区游程扫描一规范式拟合表达图象中除激励区所余下的部分构成缓变区。缓变区可看成由若干缓变区子集组成。每个缓变区子集中的灰度值或者为均匀分布，或者可用下列线性规范多项式拟合： }=ai+绣+? 02、式中，／。为象索灰度值，f，‘，为象素点位置的行号、列号。缓变区子集通过游程扫描来提取：从缓变区最左上角象素点开始．用最初的2～3个象素点求出口，厂或口，层厂的初始值，然后用上述拟合表达式来预测下一个缓变区点的灰度值。若误差在给定的容限范围之内，则将该点并人上述2～3各象素点构成的集合一“1游程”，否则开始“O游程”一误差超过容限的象素点的集合。如此反复直到缓变区的最右下角。记录相间隔的“1”、“0”游程长度和该缓变区扫描结束时的线性规范式的拟合结果，以及该缓变区子集的扫描起始点坐标，则一个缓变区子集就被表达和记录下来了。构成缓变区的所有缓变区子集皆可用上述方法表达。上述的激励区和缓变区参数共同描述了图象，经编码后传输。对于静态图象，在解码端由相应参数分别恢复激励区和缓变区后，再合成为重建图象。 2．3模型匹配与广义运动分析对于活动图象序列的编码，上述的静态图象编码作为初始帧，相继帧则采用以模型匹配与广义运动分析为核心的