网站大量收购闲置独家精品文档,联系QQ:2885784924

豆包大模型更新至1.5-pro,更真实、更懂你.pdfVIP

豆包大模型更新至1.5-pro,更真实、更懂你.pdf

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

行业专题报告/证券研究报告

内容目录

1Doubao-1.5-pro基础能力全面提升4

高效MoE模型,平衡模型性能和推理成本5

多模态能力全面提升9

1.2.1视觉多模态:性能进一步提升,从容应对更复杂场景9

1.2.2语音多模态:通过语音语义联合建模,打破传统“ASR+LLM+TTS”级联限制10

“豆包版o1”推出,实现RLscaling13

2豆包情感语音功能落地移动端,图灵测试“终结者”14

豆包电话升级情感语音功能,高拟人化应用空间广阔14

豆包情绪理解和情感表达优于GPT-4o,“去AI味”效果显著16

3投资建议17

4风险提示18

图表目录

图1.Doubao-1.5-pro在多个基准上的测评结果4

图2.Doubao-1.5-pro输入输出价格4

图3.Doubao-Dense和Doubao-MoE的训练loss图5

图4.利用二次多项式拟合,获得不同最小计算预算下激活参数最优数量的ScalingLaw6

图5.Llama3.1、Doubao-MoE和Doubao-Dense的Performance对比图7

图6.不同阶段的计算和访存特征8

图7.Doubao-1.5-pro在多个视觉基准上的测评结果9

图8.DoubaoViT在多种视觉分类任务中的表现10

图9.豆包支持任意分辨率和极端长宽比图像识别以及复杂指令遵循能力10

图10.从语音识别到语义分析到语音生成的原理图11

图11.ECSS由多源知识、基于异构图的情感上下文编码器和情感对话语音合成器三个部分组成...12

图12.近期国内更新的情感语音大模型12

图13.Doubao-1.5-pro-AS1-Preview在AIME上的评测结果13

图14.豆包推理能力的初步泛化13

图15.豆包App电话页面14

图16.豆包融入生活成为智能助手15

2

行业专题报告/证券研究报告

图17.豆包模仿经典文艺作品15

图18.豆包演唱歌曲15

图19.豆包做情感/心理疏导15

图20.豆包在角色扮演中切换自如16

图21.豆包快速切换喜怒哀乐等情绪表达16

图22.豆包根据复杂要求编故事16

图23.豆包实时联网查询播报信息16

图24.豆包实时语音大模型与GPT-4o的满意度对比17

3

行业专题报告/证券研究报告

1Doubao-1.5-pro基础能力全面提升

Doubao-1.5-pro采用MoE(混合专家)架构,通过训练—推理一体化设计,保证

模型性能的同时尽量降低推理成本。2025年1月22日,豆包底层大模型更新至

Doubao-1.5-pro(包括文本、视觉、实时语音、推理等多个专家模型),其仅用较小

的激活参数,即可超过一流超大稠密预训练模型的性能,并在多个评测基准上

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档