虚拟数字人系列之六 — 深度合成技术合规篇.docx

虚拟数字人系列之六 — 深度合成技术合规篇.docx

PAGE

PAGE1

汉坤法律评述2022年6月

汉坤法律评述

2022年6月28日

北京∣上海∣深圳∣海口∣香港

虚拟数字人系列之六—深度合成技术合规篇

作者:段志超丨徐源璟丨王媛娇1

“深度合成”是虚拟数字人制作的关键技术之一,其主要依赖自动编码器(Autoencoders)和生成对抗网络(GenerativeAdversarialNetworks)2等人工智能技术提取原始数据、进行模型训练,并在训练后对数据重建合成。为了确保该等服务提供者在技术开发和使用过程中的健康有序发展,监管部门一直在摸索对深度合成等人工智能技术合规监管的方法和路径。从我国已出台的部门规章和规范性文件来看,《网络信息内容生态治理规定》、《互联网信息服务算法推荐管理规定》、《网络音视频信息服务管理规定》均已包含概括性地对生成合成类算法和利用深度学习、虚拟现实等新技术新应用制作音视频内容等进行监管的规定。而国家互联网信息办公室于2022年1月28日发布的《互联网信息服务深度合成管理规定(征求意见稿)》(“《深度合成规定》”),则进一步厘清和细化了深度合成技术的应用场景,明确了深度合成服务提供者和使用者的信息安全义务,并规定国家网信部门负责统筹协调全国深度合成服务治理和相关监督管理工作。

一、深度合成的应用场景

根据《深度合成规定》的定义,深度合成是指利用以深度学习、虚拟现实为代表的生成合成类算法制作文本、图像、音频、视频、虚拟场景等信息的技术,并以包括但不限于的形式列举了六类技术。结合虚拟数字人的制造和商业化运营中可能出现的元素,我们将《深度合成规定》所明确列举的几类技术分类总结如下:

环节

元素内容

具体场景

对应《深度合成规定》的技术分类

创设环节

虚拟数字人的形象外观

以真人视觉形象为基础创造虚拟数字人的视觉形象(人脸替换)、无真人形象为基础创虚拟数字人视觉形象(人脸生成)

人脸生成、人脸替换、人物属性编辑、人脸操控、姿态操控等对图像、视频内容中人脸等生物特征进行生成或者编辑的技术

(“生物特征类”)

虚拟数字人的声音

以真人声音制作音频样本、以真人声音为基础的声音创设(语音转换)、仅基于文本生成的声音创设(文本转语音)

文本转语音、语音转换、语音属性编辑等对语音内容进行生成或者编辑的技术(“语音内容类”)

虚拟数字人的动作

真人驱动类虚拟数字人的动作创设(姿态操控)

生物特征类

1实习生邹奕对本文的写作亦有贡献。

2参见曹建峰:《AI生成内容发展报告2020—“深度合成”(Deepsynthesis)商业化元年》。

PAGE

PAGE6

环节

元素内容

具体场景

对应《深度合成规定》的技术分类

商业运营环节

虚拟数字人的商业化作品

虚拟数字人出演话剧、MV等视听作品或其直播(语音转换、人脸操控、姿态操控)

语音内容类

生物特征类

虚拟偶像举办演唱会

音乐生成、场景声编辑等对非语音内容进行生成或者编辑的技术(“非语音内容类”)

已故人物虚拟分身重现表演

三维重建等对虚拟场景进行生成或者编辑的技术(“三维重建”)

虚拟数字人通过AI自动生成的内容

AI智能写作、智能作画

篇章生成、文本风格转换、问答对话等对文本内容进行生成或者编辑的技术(“文本内容类”)

虚拟主播语音播报(文本转语音)

语音内容类

虚拟人问答聊天(如虚拟男友、虚拟女友等)

文本内容类

二、深度合成技术的合规要点

深度合成服务提供者,是指提供深度合成服务以及为深度合成服务提供技术支持的组织3。《深度合成规定》明确要求深度合成服务提供者应落实主体责任,从技术、内容等多角度提出了对服务者的制度管理要求。结合《深度合成规定》,我们建议虚拟数字人的技术方应重点关注以下要求:

(一)标识深度合成信息内容

《深度合成规定》对深度合成信息内容进行了分类并要求进行标识管理。若所提供的服务为具有生成或者显著改变信息内容功能的,应当使用显著方式在合理位置或区域对深度合成信息内容进行显著标识。《深度合成规定》第十四条列举的典型情境如下:

#

类型

典型情境

标识方式

1

提供模拟自然人进行文本生成或者编辑服务

智能对话、智能写作等

在文本信息内容的稿源说明处等位置

2

提供语音生成或者显著改变个人身份特征的编辑服务

合成人声、仿声等

在音频信息内容的合理区域以语音说明等方式

3

虚拟人物图像、视频生成或者显著改变个人身份特征的编辑服务

人脸生成、人脸替换、人脸操控、姿态操控等

在图像、视频信息内容的明显位置

4

生成或者编辑服务

沉浸式拟真场景等

在虚拟场景信息内容的明显位置

5

提供其他具有生成或者显著改变信息内容功能的服务的

/

在文本、图像、音频或者视频、虚拟场景等的合理位置或者区域进行显著标识

文档评论(0)

1亿VIP精品文档

相关文档