2023年AIGC深度报告ppt：新一轮内容生产力革命的起点.pptxVIP

下载本文档

5
0
约1.12万字
约 75页
2023-09-01 发布于江苏
举报
版权申诉

2023年AIGC深度报告ppt：新一轮内容生产力革命的起点.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

AIGC深度报告：新一轮内容Th产力革命的起点;AIGC破圈元年;1 . 1 A I G C 连续破圈： A I 绘画/ C h a t G P T 相继破圈;1 . 2 A I G C 定义：新的内容Th成方式、基于人工智能的技术集合;;1 . 3 A I G C 为何爆发？数据、算法、算力共振;1 . 3 A I G C 算法发展历程：早期受制于算法、算力瓶颈;2 0 1;▲ 上线于2021年10月的文本- 图像模型Disco Diffusion 开始流行;Open AI：非盈利性转向封顶盈利性公司，估值达290 亿美金。 2015年由马斯克等人创立的非盈利人工智能研究公司，启动资金10亿美金，成立初衷是与其它机构合作进行AI相关研究，并开放研究成果以促进AI技术发展，防止垄断。核心团队为CEO Sam Altman、Greg Brockman、IIya Sutskever，大都技术出身，在通用AI领域经验丰富。 2 0 1 9 年宣布从“ 非盈利” 性质过度到“ 封顶盈利性”，之后获微软1 0亿美元战略投资，并开启与微软在产品上的合作。据美国财经媒体Semafor报道，微软预计向ChatGPT的开发者OpenAI投资100亿美元，OpenAI投后估值将高达290亿美元。;1 . 3 A I G C 算法发展历程： O p e n A I 推动A I 算法模型发展 OpenAI技术发展历史;Open AI携手微软，获得资金支持，落地场景，借力微软云计算领域布局。资金+ 算力： 2019年7月，Open AI 接受了微软10亿美元的战略投资，同时将把微软的Azure作为其独家云计算供应商；2021年，微软加注投资，具体金额未公布；2023年，微软预计向Open AI再投资100亿美元，在满足首批投资者收回初始资本后，微软将获得Open AI75% 利润，直到收回投资。业务协作： 2021年，微软推出了Azure Open AI服务预览；2022年，微软将DALL- E2模型集成到了Azure Open AI、Microsoft Designer、Bing Image Creator中。2023年1月，Azure Open AI服务正式发布，企业可以申请访问包括GPT- 3. 5、Codex和DALL- E2等AI模型，之后还可能通过 Azure Open AI服务访问ChatGPT。2023年2月，微软推出ChatGPT支持的最新版本Bing搜索引擎与Edge浏览器，增加聊天写作功能。此外，微软计划将Chat GPT引入Office产品中，进一步提升市场份额。;2022年11月在AI年度活动上谷歌发布四项最新成果，其能够根据文本提示Th成高分辨率的长视频、3D模型、音乐、代码、文字内容等。结合Imagen Video和P hena ki两大模型的优势，推出超长连贯性视频Th成模型： Imagen Video是基于级联视频扩散模型的文本条件视频Th成系统，即给出文本提示，就可以通过一个由frozen T 5 文本编码器、基础视频Th成模型、级联时空视频超分辨率模型组成的系统来Th成高清视频。Phenaki模型可通过一系列提示在开放域中Th成所有时间段的视频，是谷歌首次以时间变量提示Th成视频。 L a M D A Wordcraft：在大语言模型LaMDA基础上开发的、能辅助专业作家写作的AI写文工具，帮助创作者突破“创作瓶颈”。 Audio LM ：具备“ 长期连贯性” 的高质量音频Th成框架，不需要任何文字或音乐符号表示的情况下，只在极短（三四秒即可）的音频样本基础上训练，可Th成自然、连贯、真实的音频结果，不限语音或者音乐。文字Th成3 D模型：通过结合Imagen和最新的神经辐射场( Neural Radiance Field) 技术，谷歌开发出了DreamFusion技术，可根据现有文字描述，Th成具有高保真外观、深度和法向量的3D模型，支持在不同光照条件下渲染。将推出Bard对话机器人。2023年2月，谷歌宣布将推出Bard AI聊天机器人，由谷歌大型语言模型LaMDA支持，但参数量更少，使公司能够以更低的成本提供该技术， Bard能在获得简单提示的情况下Th成详细答案。;2023 年2 月2 日，谷歌研究院等提出了一种视频T h 成新模型—— Dreamix，受到了AI作图Uni Tune的启发，将文本条件视频扩散模型（video diffusion model, VDM）应用于视频编辑。核心是通过两种主要思路使文本条件VDM保持对输入视频的高保真度：（1）不使用纯噪声作为模型初始化，而是使用原始视频的降级版本，通过缩小尺寸和添加噪声仅保留低时空信息；（2