2023年AIGC深度报告ppt:新一轮内容生产力革命的起点.pptxVIP

2023年AIGC深度报告ppt:新一轮内容生产力革命的起点.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
AIGC深度报告:新一轮内容Th产力革命的起点;AIGC破圈元年;1 . 1 A I G C 连续破圈: A I 绘画/ C h a t G P T 相继破圈;1 . 2 A I G C 定义: 新的内容Th成方式、基于人工智能的技术集合;;1 . 3 A I G C 为何爆发? 数据、算法、算力共振;1 . 3 A I G C 算法发展历程: 早期受制于算法、算力瓶颈;2 0 1;▲ 上线于2021年10月的文本- 图像模型Disco Diffusion 开 始流行;Open AI:非盈利性转向封顶盈利性公司,估值达290 亿美金。 2015年由马斯克等人创立的非盈利人工智能研究公司,启动资金10亿美金,成立初衷是与其它机构合作进行AI相关研究,并开放研究成果以促进AI技术发展,防止垄断。 核心团队为CEO Sam Altman、Greg Brockman、IIya Sutskever,大 都技术出身,在通用AI领域经验丰富。 2 0 1 9 年宣布从“ 非盈利” 性质过度到“ 封顶盈利性”, 之后获微软1 0亿美元战略投资,并开启与微软在产品上的合作。 据美国财经媒体Semafor报道,微软预计向ChatGPT的开发者OpenAI投资100亿美元,OpenAI投后估值将高达290亿美元。;1 . 3 A I G C 算法发展历程: O p e n A I 推动A I 算法模型发展 OpenAI技术发展历史;Open AI携手微软,获得资金支持,落地场景,借力微软云计算领域布局。 资金+ 算力: 2019年7月,Open AI 接受了微软10亿美元的战略投资,同时将把微软的Azure作为其独家云计算供应商;2021年,微软加注投资,具体金额未公布;2023年,微软预计向Open AI再投资100亿美元,在满足首批投资者收回初始资本后,微软将获得Open AI75% 利润,直到收回投资。 业务协作: 2021年,微软推出了Azure Open AI服务预览;2022年,微软将DALL- E2模型集成到了Azure Open AI、Microsoft Designer、Bing Image Creator中。2023年1月,Azure Open AI服务正式发布,企业可以申请访问包括GPT- 3. 5、Codex和DALL- E2等AI模型,之后还可能通过 Azure Open AI服务访问ChatGPT。2023年2月,微软推出ChatGPT支持的最新版本Bing搜索引擎与Edge浏览器,增加聊天写作功能。此外,微软计 划将Chat GPT引入Office产品中,进一步提升市场份额。;2022年11月在AI年度活动上谷歌发布四项最新成果,其能够根据文本提示Th成高分辨率的长视频、3D模型、音乐、代码、文字内容等。 结合Imagen Video和P hena ki两大模型的优势,推出超长连贯性视频Th成模型: Imagen Video是基于级联视频扩散模型的文本条件视频Th成系统,即给出文本提示,就可以通过一个由frozen T 5 文本编码器、基础视频Th成模型、级联时空视频超分辨率模型组成的系统来Th成高清视频。Phenaki模型可通过一系列提示在开放域中Th成 所有时间段的视频,是谷歌首次以时间变量提示Th成视频。 L a M D A Wordcraft: 在大语言模型LaMDA基础上开发的、能辅助专业作家写作的AI写文工具,帮助创作者突破“创作瓶颈”。 Audio LM : 具备“ 长期连贯性” 的高质量音频Th成框架,不需要任何文字或音乐符号表示的情况下,只在极短(三四秒即可)的音频样本基础上训练,可Th成自然、连贯、真实的音频结果,不限语音或者音乐。 文字Th成3 D模型: 通过结合Imagen和最新的神经辐射场( Neural Radiance Field) 技术,谷歌开发出了DreamFusion技术,可根据现有文字描述,Th成具有高保真外观、深度和法向量的3D模型,支持在不同光照条件下渲染。 将推出Bard对话机器人。2023年2月,谷歌宣布将推出Bard AI聊天机器人,由谷歌大型语言模型LaMDA支持,但参数量更少,使公司能够以更低的成本提供该技术, Bard能在获得简单提示的情况下Th成详细答案。;2023 年2 月2 日, 谷歌研究院等提出了一种视频T h 成新模型—— Dreamix,受到了AI作图Uni Tune的启发,将文本条件视频扩散模型 (video diffusion model, VDM)应用于视频编辑。核心是通过两种主要思路使文本条件VDM保持对输入视频的高保真度:(1)不使用纯噪声作为模型初始化,而是使用原始视频的降级版本,通过缩小尺寸和添加噪声仅保留低时空信息;(2

文档评论(0)

151****7306 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档