面向深度图的端到端编码技术研究.pdfVIP

下载本文档

0
0
约9.91万字
约 62页
2025-09-26 发布于江西
举报
版权申诉

面向深度图的端到端编码技术研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

摘要

随着3D电影、虚拟现实和增强现实等技术的飞速发展，3D视频数据量呈

现爆发式增长，对存储和传输系统提出了巨大的挑战。作为3D视频的重要组成

部分，深度视频记录了场景中物体的深度信息，在3D多媒体应用中具有重要的

作用。因此，研究深度图编码方法具有重要意义和应用价值。近年来，随着人工

智能技术的兴起，深度学习在图像和视频处理领域取得了显著的进展，为深度图

编码提供了新思路。本文借助于深度学习技术，探索深度图与对应彩色图之间的

结构相似性和语义相似性，开展了面向深度图的端到端编码技术研究。

本文提出了一种基于彩色特征引导的端到端深度图编码方法，通过分析深度

图与对应的彩色图之间的结构相似性和语义相似性，设计彩色引导的端到端深度

图编码机制，提取彩色特征以引导深度图编码。首先，提出了彩色特征引导的变

换模块，利用彩色图编码过程中的彩色特征引导深度图的分析变换和合成变换，

以降低深度图的数据冗余。然后，设计了彩色特征引导的条件熵模型，从彩色图

量化的潜在表示中提取彩色先验，为熵模型提供条件信息，从而提升熵模型概率

估计的准确性。实验结果表明，所提方法取得了与目前先进的深度图编码方法可

比的编码性能。

本文进一步提出了一种基于深度估计的端到端深度图编码方法。考虑到彩色

特征和深度特征之间存在一定的域差异，本文借助深度估计技术，拉近彩色特征

与深度特征之间的距离，以获得与深度特征相关性更强的条件上下文，从而引导

深度图编码。首先，设计了一个基于U-Net的深度估计模块，学习从彩色图到深

度图的映射关系，以从彩色图中获取更贴近深度特征的条件上下文。然后，提出

了深度估计引导的分析变换和合成变换结构，将条件上下文作为先验信息降低深

度图的编码冗余。最后，采用率失真-边缘联合损失函数，通过约束边缘区域的重

建结果，获取更高质量的重建深度图。实验结果表明，所提方法有效提升了深度

图的编码效率。

关键词：端到端深度图编码，深度-彩色相关性，彩色特征引导，深度估计，3D-

HEVC

ABSTRACT

Withtherapiddevelopmentoftechnologiessuchas3Dcinema,virtualrealityand

augmentedreality,theamountof3Dvideodatahasincreasedexplosively,whichbrings

hugechallengestothetransmissionandstorageof3Dvideo.Asoneoftheimportant

componentsof3Dvideo,depthvideorecordsthegeometricinformationofobjectsin

thescene,andplaysaimportantrolein3Dmultimediaapplications.Therefore,

developingefficientdepthmapcompressionmethodshasimportantsignificanceand

applicationvalue.Inrecentyears,withtheriseofartificialintelligencetechnology,

deeplearninghasmadesignificantprogressinimageandvideoprocessing,which

providingnewideasfordepthmapcompression.Inthisthesis,takingadvantageofdeep

learning,theend-to-enddepthmapcodingareresearchedbyexploringstructural

similarityandsemanticsimilaritybetweendepthmapandcorrespondingtextureimage.

您可能关注的文档

文档评论（0）

精品资料 + 关注: 实名认证

文档贡献者

温馨提示：本站文档除原创文档外，其余文档均来自于网络转载或网友提供，仅供大家参考学习，版权仍归原作者所有，若有侵权，敬请原作者及时私信给我删除侵权文

咨询Ta 进入空间

1亿VIP精品文档

更多 >

面向深度图的端到端编码技术研究.pdfVIP