- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
;
C-B里云
为了无法计算的价值
大模型产业落地洞察;
模型尺寸对模型性能的影响
MMLU分数(英文);
?相比23年,24年检索增强生成(RAG)以51%的采用率占据主导地位,与去年31%相比有了显著增长
?在实际生产模型中进行微调的情况仍然出人意料地少,仅有9%的生产模型进行了微调;
?企业更注重长远利益:他们更加关注能够提供可衡量价值(30%)以及理解其工作独特背景(26%)的工具
?价格并不是主要问题:企业领导者中只有1%提到价格作为选择的关注点;
?代码助手:代码生成领域以51%的采用率领先,成为AI最早落地场景
?会话机器人:各类支撑聊天机器人获得了显著的应用,企业采用率达到31%
?企业知识库:企业搜索/检索达到28%的采用率
?数据提取/转换:企业数据提取/转换达到27%的采用率;
C-B里云
为了无法计算的价值
大模型技术最新进展;;;
?阿里云发布全新AI推理模型QwQ-32B-Preview,并同步开源,整体推理水平比肩OpenAIo1
?QwQ模型通过耐心和深思熟虑的分析使得模型能够取得解决复杂问题的突破性进展。尤其是在数学和编程领域解决一些最具挑战性的问题方面表现出卓越能力;;;
?WorldLabs使用可以理解空间智能的AI能力对世界进行建模,还能在3D时空中对物体/地点/交互进行推理。
?实现2D图片的3D生成,视频的控制性、一致性能得到极大的改善
?这意味着未来制作电影、游戏、模拟器等其他物理世界的数字表现形式,将会发生翻天覆地的变化。;
?MetaFAIR的YannLeCun团队近期发布了导航世界模型(NavigationWorldModels/NWM)
?NWM模型能基于单生成连续一致的视频,并且更加强调世界模型的导航能力,其能够在已知环境中按照轨迹行进,也能在未知环境中自己寻找前进道路,还能执行路径规划。;
C-B里云
为了无法计算的价值
把大模型变成生产力;;;
1.交互升级:从层进式的企业服务矩阵到AI超级助手;;
基于通义千问,通过交互,利用代码编辑器、终端、??索、软件分析器等工具,自主地进行需求分解,并端到端地实现代码编写、Debug和代码提交等任务;
应用
生态;;
1.需求挑战
业务需求是否能用大模型解决?需求跟大模型无关,还是需要下一代模型能力?
2.工程挑战
大模型的业务效果达不到——基模选择、PE、SFT、RAG、Memory、Planning、ToolUse、工程workflow…到底哪里出问题?
3.成本创新速度挑战
整体降低推理成本——芯片选择、模型/算法加速、算子加速、调度加速…如何尽可能的降低成本?
AI应用建设——“一表两图”;;
信息增加强场景非常普遍,RAG已成为最优解
由于超长上下文的推理成本过高,在一段时间内,RAG将是大模型信息增强和记忆提取的主要技术;
文档评论(0)