基于人工智能的直播方法、装置、设备及存储介质.pdf

下载文档

4
0
约4.25万字
约 32页
2020-09-15 发布于湖南
举报
版权申诉
保障服务

基于人工智能的直播方法、装置、设备及存储介质.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 111010589 A (43)申请公布日 2020.04.14 (21)申请号 201911319864.9 (22)申请日 2019.12.19 (71)申请人腾讯科技（深圳）有限公司地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层 (72)发明人朱绍明　 (74)专利代理机构北京派特恩知识产权代理有限公司 11270 代理人王姗姗　张颖玲 (51)Int.Cl. H04N 21/233(2011.01) H04N 21/234(2011.01) H04N 21/235(2011.01) H04L 29/06(2006.01) G06T 3/00(2006.01) 权利要求书3页说明书22页附图6页 (54)发明名称基于人工智能的直播方法、装置、设备及存储介质 (57)摘要本发明提供了一种基于人工智能的直播方法、装置、设备及存储介质；方法包括：接收用于供虚拟主播表演的给定文本，根据所述给定文本实时获取对应所述虚拟主播的音频数据和脸部特征数据，并分别形成至少一个音频数据包和至少一个脸部特征数据包；实时基于所述脸部特征数据包中的脸部特征数据进行特效渲染处理，得到携带有对应所述虚拟主播的图像帧集合的图像数据包；实时提取所述图像数据包中的图像帧集合和所述音频数据包中的音频数据；根据所述图像帧集合和所述音频数据进行所述虚拟主播 A 的直播数据流推送，通过本发明，能够有效提高 9 直播的实时性和流畅性。 8 5 0 1 0 1 1 1 N C CN 111010589 A 权　利　要　求　书 1/3页 1.一种基于人工智能的直播方法，其特征在于，所述方法包括：接收用于供虚拟主播表演的给定文本，根据所述给定文本实时获取对应所述虚拟主播的音频数据和脸部特征数据，并分别形成至少一个音频数据包和至少一个脸部特征数据包；实时基于所述脸部特征数据包中的脸部特征数据进行特效渲染处理，得到携带有对应所述虚拟主播的图像帧集合的图像数据包；实时提取所述图像数据包中的图像帧集合和所述音频数据包中的音频数据；根据所述图像帧集合和所述音频数据进行所述虚拟主播的直播数据流推送。 2.根据权利要求1所述的方法，其特征在于，所述实时基于所述脸部特征数据包中的脸部特征数据进行特效渲染处理，得到携带有对应所述虚拟主播的图像帧集合的图像数据包，包括：当形成针对所述给定文本的至少一个脸部特征数据包中的第一个脸部特征数据包时，实时基于所述第一个脸部特征数据包中的脸部特征数据进行特效渲染处理，得到携带有对应所述虚拟主播的图像帧集合的第一个图像数据包；所述实时提取所述图像数据包中的图像帧集合和所述音频数据包中的音频数据，包括：当形成针对所述给定文本的至少一个音频数据包中的第一个音频数据包时，实时提取所述第一个音频数据包中的音频数据，以进行音频数据的推送；当形成携带有对应所述虚拟主播的图像帧集合的第一个图像数据包时，实时提取所述第一个图像数据包中的图像帧集合，以进行图像帧集合的推送。 3.根据权利要求2所述的方法，其特征在于，当从所述给定文本获取到所述第一个图像数据包所耗费的时间大于从给定文本获取到所述第一个音频数据包所耗费的时间时，所述根据所述图像帧集合和所述音频数据进行所述虚