3D内容生成技术及应用场景探究 2024.docx

3D内容生成技术及应用场景探究 2024.docx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

3D内容生成技术及应用场景探究

中国移动研究院业务研究所

2024年11月

2/18

摘要

随大语言模型与生成式AI浪潮席卷全球,3D内容生成或将迎来自己的ChatGPT时刻。3D内容生成作为新兴3D资产制作手段,为内容创作模式带来了新的变革,极大促进了3D数字化内容生产的效率提升,引起业界的广泛关注。本文探讨了3D内容生成技术的主流方法及其应用领域,尤其在文生3D和图生3D方面,业界已取得不少有代表性的进展。预计3D内容生成将在游戏、电影、通信等领域有广泛的应用,推动数字内容生态的繁荣发展。

一、3D内容生成简介

从最初的基于几何建模的手工创作,到如今的海量数据驱动的AIGC3D生成,3D内容创作的发展经历了多个阶段:

手工3D建模阶段:从1960年代起,计算机3D图形学的基础理论逐渐确立,研究人员提出了如多边形网格、样条曲线和

3/18

NURBS曲面等各种建模技术,并开始利用光栅化和光线追踪算法生成更加逼真的图像。初期3D内容的生成依赖于专业人员使用建模软件进行手动创建,早期的3D建模方法和工具较为原始,3D模型的创建主要依靠艺术家和设计师使用专业软件手工建模,工作流程包括几何建模、纹理贴图、光照设置等,整个过程耗时且成本较高。这一时期的3D内容生成工作量大、耗时长,对建模人员的技术要求较高。

基于扫描与重建阶段:随着计算机硬件和传感器技术的发展,3D扫描与自动化重建技术逐渐兴起,激光扫描和结构光扫描技术能够获取物体和场景的高精度点云数据,并重建其3D模型。这一阶段,3D扫描与重建被广泛用于文物保护、医疗成像、逆向工程等领域,三维模型的生成效率和精度都得到了提升,

不过生成的模型通常还需要后期处理,以优化模型效果和细节。

基于AI的智能3D生成阶段:在深度学习等技术驱动下,3D

4/18

内容生成进入了新的智能化阶段。生成对抗网络(GAN)、变分自编码器(VAE)等模型能够从大量数据中学习并生成新的3D内容,被用于3D模型生成、纹理映射和风格迁移等任务。神经辐射场(NeRF)技术的提出,以及大型语言模型(LLM)和扩散模型(DM)的发展,进一步推动了3D内容生成的能力,现阶段3D

内容生成模型具备了从文本、图像中生成对应3D模型的能力:

文生3D(Text-to-3D)是指通过输入文字描述来生成对应的3D模型。使用自然语言作为与用户交互的方式已经愈发成熟,这种生成方式具有高度的灵活性和创造性,用户可以通过简单的文字描述表达自己的创意和需求,然后由生成式模型生成相应的3D模型。文生3D中,生成质量、多样性和效率是目前业界关注的关键问题。

图生3D(Image-to-3D)是指通过输入二维图像来生成三

维模型。这种方法通常利用了深度学习等技术,通过对大

5/18

量二维图像数据的学习,能够从一张二维图像中推断出物体的三维形状和结构。例如一些应用允许将用户上传的照片转换为3D模型,为用户提供更加生动的视觉体验。此外还可以通过布局或线稿引导来生成相应的3D模型。例如,在建筑设计中,设计师可以通过提供建筑的平面图和剖面图,由3D生成式系统生成建筑的3D模型。3D模型细节还原性、形状和结构推断准确性等是目前业界普遍关注的关键问题。

二、3D内容生成分类

按生成内容类别的不同,3D内容生成可以进一步细化为物体生成、场景生成、人体生成、人脸生成。

物体生成:物体生成主要聚焦从文本或图像中生成特定类别的3D物体模型,通常也是三维环境及场景生成的基础。Text2Shape(2018)是首个尝试利用自然语言描述生成3D形状的工作,基于ConditionalWassersteinGAN。Nvdia的

6/18

GET3D(2022)提出了一种可以生成高质量纹理3D形状的生成模型,能够生成显式纹理3D网格。

场景生成:场景生成的难度比单个物体更大,因为它需要考虑物体之间的空间关系,可以创建丰富多样的场景,为游戏、建筑设计、工业设计等行业提供强大的支持。DreamScene(2024)基于显式表征3D高斯泼溅(3DGS),通过文本生成高质量、视角一致且可编辑的3D场景。斯坦福与MIT近期推出WonderWorld(2024),实现了从单一图像出发在用户实时交互下生成无限延展的3D场景,将交互式3D世界生成推向实时

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档