AI行业深度更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.docx

AI行业深度更新报告:大模型“开源、轻量、端侧”化,视频与语音加速落地.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

目录

TOC\o1-3\h\z\u大模型侧:开源能力快速提升,轻量化趋势显著 3

趋势一:开源模型发展,能力快速接近闭源产品水平 3

趋势二:“轻量化”,模型“性价比”快速提升 4

趋势三:端测模型发展,AI硬件已经开始布局 5

AI生成视频:能力兑现有望加速 7

sora打破以往时长限制,树立行业标准 7

sora的“高度一致性”、“60s时长”为行业树立全新的标准 7

采用DiT思路,大规模训练下体现出“涌现”能力 8

6月以来多家“AI视频”产品推出,产业呈现加速发展 9

快手可灵:已有多次升级,面向全球并尝试商业化 10

智谱“清影”:AI大模型团队的“视频”领域尝试 11

RunwayGen-3Alpha:视频领域“老将”,继续画质领跑 13

LumaDreamMachine:3D资产经验助力“AI视频”拓展 13

语音功能:或助推AI产品迭代 15

以GPT-4o语音为代表,相比传统TTS信息更多 15

GPT4-o:无延迟对话、理解和表达情感 15

字节跳动Seed-TTS:可在表现力上接近人类水平 16

ChatTTS:流畅语音合成,可预测和控制细粒度的韵律特征 17

应用端:可显著提升教育和情感陪伴应用体验 18

口语等教学场景质量有望提升 18

情感陪伴:有望增加情感认同及潜在付费点 20

投资建议 21

风险提示 22

大模型侧:开源能力快速提升,轻量化趋势显著

趋势一:开源模型发展,能力快速接近闭源产品水平

开源模型Llama3.1发布,追平GPT-4o和Claude3.5Sonnet。2024年7月23日,Meta推出Llama3.1,将上下文长度扩展到128K,增加了对八种语言的支持,共包括8B、70B和405B三个尺寸。其405B的版本从性能上已

经可媲美GPT-4o和Claude3.5,而其8B和70B版本都均超越同等尺寸的其他开源模型。

图1:Llama3.1性能上追平GPT-4o和Claude3.5Sonnet

数据来源:Meta

图2:Llama8B和70B能力超越同尺寸其他开源模型

数据来源:Meta

顶尖的开源模型趋近顶尖的闭源模型,Llama3.1或标志行业转折点。整体来看,开源大型语言模型在功能和性能方面仍大多落后于闭源模型,但开源模型的成长性有更高的斜率,随着时间推进,开源模型的能力在快速赶上,如在MMLU的测试维度中,最新的Llama3.5405B就已经非常接近Cluade

3.5Sonnet。开源模型更为开放,在学习和成长上来源丰富,其与闭源模型的差距有望持续缩小,甚至超越。

图3:开源模型能力快速接近闭源产品

数据来源:maximelabonne,36Kr

2024年以来开源模型频现,能力不断刷新。7月,MistralAI发布最新模型MistralLarge2,参数123B,用不到三分之一的参数量性能比肩Llama3.1405B,也不逊于GPT-4o、Claude3Opus等闭源模型。2024年以来推出的开

源模型不在少数,性能上足以媲美当前领先的闭源模型。

表1:推荐公司盈利预测与估值情况表

产品名 厂商 发布时间 参数量 模型能力水平

Gemma 谷歌 2月 2B、7B 大幅超过Llama2

Phi-3-mini 微软 4月 3.8B 优于Llama8B

Llama3 Meta 5月 8B、70B 接近GPT-4

DeepSeekv2 DeepSeek 5月 236B GPT-4TurboLlama3.1 Meta 7月 8B、70B、405B GPT-4oQwen2-72B 阿里巴巴 6月 72B 超过Llama3-70B

MistralLarge2 MistralAI 7月 123B Llama3.1405B、GPT-4o、Claude3Opus

数据来源:智东西,机器之心,量子位,

趋势二:“轻量化”,模型“性价比”快速提升

大模型性价比逐年提升,优秀轻量模型层出不穷。成本更低的模型往往表现也更弱,但是随着相关研究推进,2022-2024年在同等成本下的大模型表

现逐年提升,2024年轻量模型赛道也吸引了各家机构的关注,各类轻量模型层出不穷。

图4:轻量级模型更具性价比

数据来源:semaphore

表2:2024年以来领先轻量级通用语言模型不断出现

机构 模型 参数规模 上下文长度

面壁智能阿里巴巴

Goog

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档