- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
3D内容生成技术及应用场景探究
中国移动研究院业务研究所
2024年11月
2/18
摘要
随大语言模型与生成式AI浪潮席卷全球,3D内容生成或将迎来自己的ChatGPT时刻。3D内容生成作为新兴3D资产制作手段,为内容创作模式带来了新的变革,极大促进了3D数字化内容生产的效率提升,引起业界的广泛关注。本文探讨了3D内容生成技术的主流方法及其应用领域,尤其在文生3D和图生3D方面,业界已取得不少有代表性的进展。预计3D内容生成将在游戏、电影、通信等领域有广泛的应用,推动数字内容生态的繁荣发展。
一、3D内容生成简介
从最初的基于几何建模的手工创作,到如今的海量数据驱动的AIGC3D生成,3D内容创作的发展经历了多个阶段:
手工3D建模阶段:从1960年代起,计算机3D图形学的基础理论逐渐确立,研究人员提出了如多边形网格、样条曲线和
3/18
NURBS曲面等各种建模技术,并开始利用光栅化和光线追踪算法生成更加逼真的图像。初期3D内容的生成依赖于专业人员使用建模软件进行手动创建,早期的3D建模方法和工具较为原始,3D模型的创建主要依靠艺术家和设计师使用专业软件手工建模,工作流程包括几何建模、纹理贴图、光照设置等,整个过程耗时且成本较高。这一时期的3D内容生成工作量大、耗时长,对建模人员的技术要求较高。
基于扫描与重建阶段:随着计算机硬件和传感器技术的发展,3D扫描与自动化重建技术逐渐兴起,激光扫描和结构光扫描技术能够获取物体和场景的高精度点云数据,并重建其3D模型。这一阶段,3D扫描与重建被广泛用于文物保护、医疗成像、逆向工程等领域,三维模型的生成效率和精度都得到了提升,
不过生成的模型通常还需要后期处理,以优化模型效果和细节。
基于AI的智能3D生成阶段:在深度学习等技术驱动下,3D
4/18
内容生成进入了新的智能化阶段。生成对抗网络(GAN)、变分自编码器(VAE)等模型能够从大量数据中学习并生成新的3D内容,被用于3D模型生成、纹理映射和风格迁移等任务。神经辐射场(NeRF)技术的提出,以及大型语言模型(LLM)和扩散模型(DM)的发展,进一步推动了3D内容生成的能力,现阶段3D
内容生成模型具备了从文本、图像中生成对应3D模型的能力:
文生3D(Text-to-3D)是指通过输入文字描述来生成对应的3D模型。使用自然语言作为与用户交互的方式已经愈发成熟,这种生成方式具有高度的灵活性和创造性,用户可以通过简单的文字描述表达自己的创意和需求,然后由生成式模型生成相应的3D模型。文生3D中,生成质量、多样性和效率是目前业界关注的关键问题。
图生3D(Image-to-3D)是指通过输入二维图像来生成三
维模型。这种方法通常利用了深度学习等技术,通过对大
5/18
量二维图像数据的学习,能够从一张二维图像中推断出物体的三维形状和结构。例如一些应用允许将用户上传的照片转换为3D模型,为用户提供更加生动的视觉体验。此外还可以通过布局或线稿引导来生成相应的3D模型。例如,在建筑设计中,设计师可以通过提供建筑的平面图和剖面图,由3D生成式系统生成建筑的3D模型。3D模型细节还原性、形状和结构推断准确性等是目前业界普遍关注的关键问题。
二、3D内容生成分类
按生成内容类别的不同,3D内容生成可以进一步细化为物体生成、场景生成、人体生成、人脸生成。
物体生成:物体生成主要聚焦从文本或图像中生成特定类别的3D物体模型,通常也是三维环境及场景生成的基础。Text2Shape(2018)是首个尝试利用自然语言描述生成3D形状的工作,基于ConditionalWassersteinGAN。Nvdia的
6/18
GET3D(2022)提出了一种可以生成高质量纹理3D形状的生成模型,能够生成显式纹理3D网格。
场景生成:场景生成的难度比单个物体更大,因为它需要考虑物体之间的空间关系,可以创建丰富多样的场景,为游戏、建筑设计、工业设计等行业提供强大的支持。DreamScene(2024)基于显式表征3D高斯泼溅(3DGS),通过文本生成高质量、视角一致且可编辑的3D场景。斯坦福与MIT近期推出WonderWorld(2024),实现了从单一图像出发在用户实时交互下生成无限延展的3D场景,将交互式3D世界生成推向实时
您可能关注的文档
- 【DT商业观察】2024住酒店趋势报告.docx
- 【Sinomonitor】2024智能家居品牌实力评估报告.docx
- 2024年浙江省上市企业可持续表现白皮书.docx
- AI赋能无线网络:标准进展、挑战与展望 2024.docx
- Horizons阿联酋出海白皮书2024.docx
- 大家居思维运营策划 -大商思维 -业绩持续高增长.docx
- 大家居思维运营策划 -大商思维 -业绩持续高增长.pdf
- 房地产 -2024年1-11月房地产行业数据点评.docx
- 房地产 -2024年11月房地产行业运行情况报告:量价指标延续积极变化 投资端修复仍需时间 -东方金城.docx
- 房地产政策动向和市场影响 -住房销售取消公摊的政策研究.docx
文档评论(0)