AI行业深度更新报告：大模型“开源、轻量、端侧”化，视频与语音加速落地.docx

下载文档

15
0
约1.59万字
约 21页
2024-09-06 发布于北京
举报
版权申诉
保障服务

AI行业深度更新报告：大模型“开源、轻量、端侧”化，视频与语音加速落地.docx

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

TOC\o1-3\h\z\u大模型侧：开源能力快速提升，轻量化趋势显著 3

趋势一：开源模型发展，能力快速接近闭源产品水平 3

趋势二：“轻量化”，模型“性价比”快速提升 4

趋势三：端测模型发展，AI硬件已经开始布局 5

AI生成视频：能力兑现有望加速 7

sora打破以往时长限制，树立行业标准 7

sora的“高度一致性”、“60s时长”为行业树立全新的标准 7

采用DiT思路，大规模训练下体现出“涌现”能力 8

6月以来多家“AI视频”产品推出，产业呈现加速发展 9

快手可灵：已有多次升级，面向全球并尝试商业化 10

智谱“清影”：AI大模型团队的“视频”领域尝试 11

RunwayGen-3Alpha：视频领域“老将”，继续画质领跑 13

LumaDreamMachine：3D资产经验助力“AI视频”拓展 13

语音功能：或助推AI产品迭代 15

以GPT-4o语音为代表，相比传统TTS信息更多 15

GPT4-o：无延迟对话、理解和表达情感 15

字节跳动Seed-TTS：可在表现力上接近人类水平 16

ChatTTS：流畅语音合成，可预测和控制细粒度的韵律特征 17

应用端：可显著提升教育和情感陪伴应用体验 18

口语等教学场景质量有望提升 18

情感陪伴：有望增加情感认同及潜在付费点 20

投资建议 21

风险提示 22

大模型侧：开源能力快速提升，轻量化趋势显著

趋势一：开源模型发展，能力快速接近闭源产品水平

开源模型Llama3.1发布，追平GPT-4o和Claude3.5Sonnet。2024年7月23日，Meta推出Llama3.1，将上下文长度扩展到128K，增加了对八种语言的支持，共包括8B、70B和405B三个尺寸。其405B的版本从性能上已

经可媲美GPT-4o和Claude3.5，而其8B和70B版本都均超越同等尺寸的其他开源模型。

图1：Llama3.1性能上追平GPT-4o和Claude3.5Sonnet

数据来源：Meta

图2：Llama8B和70B能力超越同尺寸其他开源模型

数据来源：Meta

顶尖的开源模型趋近顶尖的闭源模型，Llama3.1或标志行业转折点。整体来看，开源大型语言模型在功能和性能方面仍大多落后于闭源模型，但开源模型的成长性有更高的斜率，随着时间推进，开源模型的能力在快速赶上，如在MMLU的测试维度中，最新的Llama3.5405B就已经非常接近Cluade

3.5Sonnet。开源模型更为开放，在学习和成长上来源丰富，其与闭源模型的差距有望持续缩小，甚至超越。

图3：开源模型能力快速接近闭源产品

数据来源：maximelabonne，36Kr

2024年以来开源模型频现，能力不断刷新。7月，MistralAI发布最新模型MistralLarge2，参数123B，用不到三分之一的参数量性能比肩Llama3.1405B，也不逊于GPT-4o、Claude3Opus等闭源模型。2024年以来推出的开

源模型不在少数，性能上足以媲美当前领先的闭源模型。

表1:推荐公司盈利预测与估值情况表

产品名厂商发布时间参数量模型能力水平

Gemma 谷歌 2月 2B、7B 大幅超过Llama2

Phi-3-mini 微软 4月 3.8B 优于Llama8B

Llama3 Meta 5月 8B、70B 接近GPT-4

DeepSeekv2 DeepSeek 5月 236B GPT-4TurboLlama3.1 Meta 7月 8B、70B、405B GPT-4oQwen2-72B 阿里巴巴 6月 72B 超过Llama3-70B

MistralLarge2 MistralAI 7月 123B Llama3.1405B、GPT-4o、Claude3Opus

数据来源：智东西，机器之心，量子位，

趋势二：“轻量化”，模型“性价比”快速提升

大模型性价比逐年提升，优秀轻量模型层出不穷。成本更低的模型往往表现也更弱，但是随着相关研究推进，2022-2024年在同等成本下的大模型表

现逐年提升，2024年轻量模型赛道也吸引了各家机构的关注，各类轻量模型层出不穷。

图4：轻量级模型更具性价比

数据来源：semaphore

表2:2024年以来领先轻量级通用语言模型不断出现

机构模型参数规模上下文长度

面壁智能阿里巴巴

Goog

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

AI行业深度更新报告：大模型“开源、轻量、端侧”化，视频与语音加速落地.docx