- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目录
一、行业变化 1
大数据人工智能公司Databricks开源通用大模型DBRX 1
Databricks发布的DBRX模型与其他公司大模型的功能性对比 1
Databricks发布的DBRX模型的训练与推理效率 5
二、持续关注标的 6
三、行情回顾 7
四、产业要闻 10
五、重要公告 12
六、风险提示 13
图表目录
图表1:Databricks官网的开源DBRX模型用户注册界面 1
图表2:DBRX模型与其他开源AI大模型在语言理解、编程、数学三个方面的能力对比 2
图表3:DBRX在不同基准下与其他开源大模型的能力对比 3
图表4:DBRX与其他闭源大模型的性能基准对比 4
图表5:DBRX与其他模型的长上下文基准测试比较 4
图表6:DBRX在两个RAG基准(NaturalQuestions和HotPotQA)上的质量对比 5
图表7:Gemini1.5Pro上下文窗口方面与其他模型对比 5
图表8:DBRX推理效率对比 6
图表10:人工智能(中证)个股周涨幅前十名(%) 7
图表11:人工智能(中证)个股周涨幅后十名(%) 7
图表12:重点公司股票涨跌详情(盈利预测均为Wind一致预测) 8
请务必阅读正文之后的免责条款和声明。
一、行业变化
大数据人工智能公司Databricks开源通用大模型DBRX
3月27日,Databricks公司宣布开源通用大模型DBRX(图表1),在综合所有的大模型评价标准后,DBRX无疑是目前表现质量最高的开源大模型之一,Databricks公司树立了一个新的开源大模型行业标杆。同时,DBRX模型还开放了API的使用,开源社区与企业们可以自己去运行和调用DBRX。根据Databricks公司自身公布的测评结果,DBRX模型超越了OpenAI的GPT-3.5,可以和Gemini1.0Pro相竞争。除此之外,DBRX还是一个在代码生成领域表现尤其优秀的模型,它在编程方面的能力超过了例如CodeLLaMA-70B此类的一些专注于编程领域的大模型。
图表1:Databricks官网的开源DBRX模型用户注册界面
资料来源:Databricks官网,
根据Databricks官网,DBRX是一个基于transformer的Decoder-Only大语言模型。DBRX共有1320亿参数,其中360亿参数在面临输入时时刻保持活跃状态,剩余的980亿参数则为专家混合层。DBRX模型采用了专家混合模型(MoE)架构,由12T文本和代码数据预训练而成。
更细粒度的MoE:对比其他开源的MoE架构大模型,例如Mixtral和Grok-1,DBRX更加具有细粒度,这代表它使用了更多的小型专家模型。DBRX从16个专家模型中选择4个,而类似Mixtral和Grok-1则从8个专家模型中选择两个。这额外提供了65倍可能的专家模型组合,Databricks公司表示这种变化提升了模型的质量。此外,DBRX还使用了tiktoken存储库中提供的GPT-4分词器。
Databricks发布的DBRX模型与其他公司大模型的功能性对比
在本周三DBRX模型正式开源后,Databricks公司官网也可查询到公司发布的DBRX模型与其他公司
行业动态报告
(Meta、MixtralAI、xAI等)的大模型性能对比。图表2中直观的呈现了在语言理解,编程,数学三个方面DBRX模型比起其他开源大模型更为强大的能力。另外,官网不仅公布了DBRX与其他开源大模型的性能对比,还公布了DBRX与一些闭源大模型的能力对比。
图表2:DBRX模型与其他开源AI大模型在语言理解、编程、数学三个方面的能力对比
资料来源:Databricks官网,
图表3详细显示了DBRX和其他公司的开源大模型在不同应用领域的比较结果。从图表3可以看出,DBRX的指导分数在综合基准、编程与数学能力、MMLU三个方面表现优越。综合基准方面,DBRX在theHuggingFaceOpenLLMLeaderboard(ARC-Challenge、HellaSwag、MMLU、TruthfulQA、WinoGrande和GSM8k的平均值)和DatabricksModelGauntlet(包含世界知识,语言理解,典型问题解决等6个领域的30个任务维度)。
您可能关注的文档
最近下载
- 广电集团绩效考核指标汇编.doc VIP
- midas Gen建筑结构屈曲分析.pdf
- 【中考真题】2024年安徽省中考历史真题试卷(含答案).pdf VIP
- 2025年数字出版与阅读课程考试试卷及答案.docx
- 《神秘的非洲美术》教学课件-2024-2025学年浙人美版(2024)初中美术七年级下册.pptx VIP
- 义务教育优质均衡发展应知应会 .pdf
- 2025年中盐安徽红四方肥业股份有限公司招聘笔试参考题库附带答案详解.pdf
- YY_T 1426.1-2016 外科植入物 全膝关节假体的磨损 第1部分:载荷控制的磨损试验机的载荷和位移参数及相关的试验环境条件 含2023年第1号修改单.docx VIP
- 影响地理事物(现象)的因素.ppt
- (KPI绩效考核)广电集团绩效考核指标汇编.docx VIP
文档评论(0)