- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
AI眼镜——多模态大模型的纽北赛道邢孝慈 豆包大模型产品解决方案总监
一、大模型技术发展趋势
ChatBot、Copilot、Agent、AI助手、Act时代长文本多模态慢思考AI应用大模型技术发展趋势
判断1:大模型对基础设施变革明确,但AI应用依然处在发展初期*Source:红杉、Statista、财报、火山引擎整理Developer全球企业软件互联网AppsDataDevice苹果联想三星OPPOSecurityInfra企业软件互联网中国火山方舟扣子HiAgent联想OPPOvivoAI豆包语音大模型豆包视觉大模型豆包大语言模型AI云原生AI+数据AI+安全
判断1:大模型对基础设施变革明确,但AI应用依然处在发展初期行业分类头部公司总估值(亿美金)头部公司总融资额(亿美金)头部公司总收入(亿美金)头部公司数量营销48937销售1197110客服125221116代情6452医药872827法律52825金融712244GPU云300146244机器人361314工具类(如LLM训练/微调/推理工具)199421115生成类(视频生成、3D生成、虚拟人生成等据/网络安全551325其otal153640579125
判断2:AI应用逐步从替代工具,到替代服务SoftwareSoftwareasaServiceAIasaSoftwareServiceasaSoftware$350B软件市场$6B云软件市场$650B软件市场$400B云软件市场$10T+软件和服务市场$3BAl软件市场$650B软件市场$3BAI软件市场35065065010000640033*Source:红杉、火山引擎整理
判断3:24年调用量在快速发展,25年AI应用市场依然会保持10倍速增长*Source:MenloVentures,单位USDMillions;右图为豆包5-12月真实调用量生成式人工智能支出2023vs2024豆包大模型日均tokens调用量TotalFoundationmodelsVerticalAIHorizontalAI05000100001500030013800100065001001200225016006.1X6.5X12.0X5.3X5月7月9月12月0200004000012005000130004000033倍
判断3:24年调用量在快速发展,25年AI应用市场依然会保持10倍速增长9月日均Tokens调用量8.3%学习教育6.2%AI工具29.0%信息处理36.7%互动娱乐11.6%硬件助手8.3%客服与销售12月日均Tokens调用量4.0%其他23.0%互动娱乐41.0%信息处理旅游规划、金融风险评估、法律事务处理、历史研究医疗临床试验、汽车运营等场景14.0%AI工具9.0%客服与销售7.0%硬件助手3.0%学习教育
AI应用/AIAgent落地需要打破更多壁垒构建AI应用/AIAgent的关键路径模型选择多模态模型多尺寸模型导入自有模型模型评估模型市场成本、延时性能优化延时优化的推理训推一体KVCache模型蒸馏PD分离架构企业数据与知识融合Fine-tuning提示词工程GraphRAGAI搜索与推荐企业知识库数据与模型安全PCC私密云操作审计环境隔离AIchecks建立和编排Agents工作流智能体开发
二、大模型落地的挑战与应对
挑战1:在业务落地中选择更强的模型
举例:豆包·视觉理解模型应用场景模型优势更强内容识别能力图像知识、动作情绪、位置状态、中国传统文化、文字信息更强理解和推理能力数学、逻辑、代码更细腻的视觉描述能力细节描述、指令遵循、多种文体创作金融票据具身智能图像搜索图片审核电商直播质检报告图表解读图片打标拍照解题手写批改拍照搜索金融直播质检金融投资研究基于图片生成爆款文案文档图片识别自动驾驶训练智能手机助手作文批改儿童拍照对话购物小票识别照片故事生成教育场景旅游场景电商营销场景
豆包·视频生成模型,精准语义理解、强大动态及运镜能力通过精准语义理解、强大动态及运镜能力创作高质量视频,支持文本和图片生成两种模式应用场景电商营销动画教育城市文旅微剧本(音乐MV、微电影、短剧等)模型优势多动作多主体交互一致性多镜头生成强大动态与炫酷运镜多风格多比例高效的DiT融合计算单元更充分地压缩编码视频与文本全新设计的扩散模型训练方法一致性多镜头生成深度优化的Transformer结构大幅提升视频生成的泛化能力
挑战2:实现成本、延时和性能优化Context上下文缓存:更快,更省Prefixcache助力一致性、高频命中场景Session
您可能关注的文档
市场分析:提供详细的市场规模、市场趋势、市场需求以及竞争格局的分析,帮助客户了解行业的现状和发展前景。 竞争对手研究:深入分析主要竞争对手的市场份额、业务模式、优势劣势等,提供差异化竞争策略建议。 行业动态:跟踪行业最新的政策法规、技术创新和市场动向,帮助客户及时掌握行业变化。 客户需求分析:研究目标客户的偏好、消费习惯和需求变化,为产品定位和市场营销提供支持。 投融资分析:分析行业内的投融资活动和资本流向,帮助客户评估投资机会和风险。
文档评论(0)