- 1、本文档共17页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
虚拟数字人全景深度解析
虚拟数字人行业与虚拟现实、人工智能、元宇宙等产业发展息息相关。近年来,国家发布多项政策支持我国虚拟现实产业发展,并将虚拟现实和增强现实与云计算、大数据、物联网、工业互联网、区块链、人工智能一起列为数字经济重点产业。数字人作为与虚拟世界交互的重要载体,潜在市场空间广阔。目前国内虚拟数字人产业链布局已趋于完善,未来有望借助于在应用场景领域的优势,在政策大力支持下,迎来快速发展阶段。
01
虚拟数字人行业概览虚拟数字人是指具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人依赖显示设备存在,并且拥有类人的生理构造(模仿人的形象、肢体构造)、人的行为(能说话、能运动)以及人的思想(基本的逻辑能力、并可以出输出内容如书写、与人交谈)。资料来源:行行查
虚拟数字人的发展与其制作技术的进步密不可分,从最早的手工绘制到现在的CG、人工智能合成,虚拟数字人大致经历了萌芽、探索、初级和成长四个阶段。
作为元宇宙底层技术与核心资产之一,虚拟人技术具备较大的应用空间。虚拟数字人在元宇宙这一生态圈层中担任着信息制造、信息传递的重要角色,是元宇宙“人-物-场”链接的核心数字资产与要素。虚拟数字人正迅速触及各行业及各应用领域,并给传统市场带来积极变革。目前虚拟数字人技术仍主要用于虚拟偶像、电商直播、短视频、新闻综艺节目等泛娱乐行业,并不断向金融、教育、医疗、文旅、社交等领域拓展,为众多行业赋能。02
虚拟数字人分类
按技术分类虚拟人可分为算法驱动型(AI实时或捏脸等)和真人驱动型(动作捕捉)。真人驱动型通过真人(俗称皮套人、中之人)来驱动数字人,主要原理是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在虚拟数字人形象上,从而与用户进行交互。它生成的往往是一个静态模型,在绑定关键点之后,需要借助真人通过动作捕捉设备进行形体、眼神、动作等的捕捉,然后才能进行驱动和渲染。当前关注度较高的真人驱动型虚拟数字人主要有Siren(来自腾讯)、A-SOUL女团(来自乐华娱乐、字节跳动)、VIVI子涵(来自京东)等。算法驱动型通过智能系统自动读取并解析识别外界输入信息,根据解析结果决策虚拟数字人后续的输出文本,然后驱动人物模型生成相应的语音与动作来使虚拟数字人跟用户互动。该人物模型是预先通过AI技术训练得到的,可通过文本驱动生成语音和对应动画。它是基于深度学习模型的三维场景表达和对应的神经渲染管线,可以自驱动学习模特说话时的唇动、表情、语音以及姿态和动作等。当前关注度较高的算法驱动型虚拟数字人主要有华智冰(来自智源研究院、智谱AI、小冰公司)、洛天依(来自Yamaha)、柳夜熙(来自创壹科技)等。资料来源:行行查按核心功能分类:虚拟人可分为服务型和身份型服务型虚拟数字人:可提供服务而具备功能性,可替代真人完成任务或提供日常陪伴、关怀等服务,如虚拟主播、虚拟老师、虚拟陪伴助手等。身份型虚拟数字人:与缺乏人格象征的服务型虚拟数字人相比,身份型虚拟数字人具备鲜明身份性,可用于娱乐/社交等场合,如虚拟IP/偶像、虚拟世界第二分身。虚拟IP在现实世界中并不存在对应的真人,其外貌特征、基本人设、各类偏好、背景信息等均由人为设定。在虚拟IP领域,大多会采用真人驱动的方式进行运营,但对应的真人演员与虚拟IP本身并无强绑定关系另外,按视觉维度分类虚拟人可分为2D型和3D型;按结构组成分类虚拟人可分为数字型(用户线上观看)和全息型(用户现场裸眼观看)。
03
虚拟数字人行业制作流程三大关键环节虚拟数字人的制作流程涵盖了诸多技术,制作方式与制作技术仍在不断进化中。虚拟人制作流程中最为核心、最具挑战的是建模、驱动、渲染三大流程。建模环节以真人为模型或设计人物为虚拟数字人建立基本的3D模型。3D 建模为构建虚拟人形象的基础,重点在于实现细节的精细还原。驱动环节通过真人动作捕捉(真人驱动型)、训练驱动模型(算法驱动型)等形式确定虚拟数字人的基本动作。渲染环节根据在设计环节中确定的虚拟人最终呈现效果和应用场景等外界要素,将模型与其运动进行渲染以呈现最佳效果。渲染技术用于提升虚拟人的逼真程度,实时互动亦需要实现实时渲染。
五大关键模块
虚拟数字人的三大基本特征(具备人的外观、人的行为、人的思想),基于大量技术栈的支撑,涉及硬件设备和软件算法众多领域:图形识别、视觉技术、3D建模、CG渲染、动作捕捉、人工智能、计算机语音技术、自然语言处理等。而一个虚拟数字人,一般情况下会由人物形象、语音生成、动画生成、音视频合成显示、交互等五个模块构成。
04
虚拟数字人行业应用价值:从人机交互到人“人”交互
随着AI技术的成熟、5G网络的普及以及虚拟现实终端的应用,人机交互方式从最早PC时代
您可能关注的文档
- 生成式AI专题研究报告:海内外公司布局梳理.docx
- 数据治理体系完整指南.docx
- 万字详述:Zapier通往1.4亿美金ARR的内容营销之道.docx
- 物联网平台产品的修行和破局.docx
- 稀土:关键战略资源,产业链深度解析.docx
- 小红书爆文密码 一月爆款笔记案例解析.docx
- 小红书情人节营销指南.docx
- 新能源商用车行业深度报告:换电重卡,新万亿航道的发令枪.docx
- 亚马逊功能设计分析:ERP FBA+头程.docx
- 央企数字化转型有哪些场景.docx
- GB/T 45498.2-2025中华人民共和国社会保障卡一卡通规范 第2部分:应用规范.pdf
- GB/T 37507-2025项目、项目群和项目组合管理项目管理指南.pdf
- 《GB/T 45498.3-2025中华人民共和国社会保障卡一卡通规范 第3部分:安全规范》.pdf
- 中国国家标准 GB/T 37507-2025项目、项目群和项目组合管理项目管理指南.pdf
- 中国国家标准 GB/T 20236-2025非金属材料的聚光加速户外暴露试验方法.pdf
- 《GB/T 20236-2025非金属材料的聚光加速户外暴露试验方法》.pdf
- 《GB/T 9065.2-2025液压传动连接 软管接头 第2部分:24°锥形》.pdf
- 中国国家标准 GB/T 33523.600-2025产品几何技术规范(GPS) 表面结构:区域法 第600部分:区域形貌测量方法的计量特性.pdf
- 《GB/T 33523.600-2025产品几何技术规范(GPS) 表面结构:区域法 第600部分:区域形貌测量方法的计量特性》.pdf
- GB/T 33523.600-2025产品几何技术规范(GPS) 表面结构:区域法 第600部分:区域形貌测量方法的计量特性.pdf
文档评论(0)