- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
微信元宝与Deepseek
•微信接入DeepSeek模型后,相应推理算力需求:
目前在灰度测试阶段已观到显著增长趋势,当前预计在下半年全量开放后日均请求量将达到10亿次,并发峰
值可能达到百万级别。
同时据测算,为支撑如此规模,需要数千张GPU卡(H20和H100混搭)。
为优化资源利用率,将结合混元基础推理等策略,根
微信元宝与Deepseek
•微信接入DeepSeek模型后,相应推理算力需求:
目前在灰度测试阶段已观到显著增长趋势,当前预计在下半年全量开放后日均请求量将达到10亿次,并发峰
值可能达到百万级别。
同时据测算,为支撑如此规模,需要数千张GPU卡(H20和H100混搭)。
为优化资源利用率,将结合混元基础推理等策略,根据查询类型动态分配不同深度的推理路径,以降低整体负
载。
比如在具体实现中,会先通过预处理判断查询类型,再决定调用哪种类型的推理路径。
例如,对于简单查,可采用混元基础准理以降低计算成本(相比DeepSeek满血版可节省30%推理算力需
求):对于复杂查间,则调用深度推理路径(DeepSeek满血版)以确保结果质量。
这种动态分配机制旨在平衡性能与成本,同时提升整体系统效率。
元宝接入满血版DeepSeek模型后,其日活跃用户(DAU)仍维持在百万级别,相
对较低。
同时,由于分配到的算力资源有限,其响应时间及每秒生成内容数量也不高,
因此实际业务增量并不显著。
品牌热度虽有所提升,但未能转化为大规模用户增长。
此
外,腾讯视频计划基于DeepSeek开发新的应用场景,例如面试过程记录等功能;腾讯
地图则希望通过集成大模型优化标注团队效率,实现降本,同时提升从路径规划等能力,以增强市场竞争力。
腾讯2025年GPU扩充规划:
预计2025年整体扩充GPU卡数量同比增长约30%。
其中NV系列仍占主导地位;
国产芯片占比20%-30%,存在一定浮动空间。
然而,由于NV系列订货周期问题,该比例可能会动态调整以适应实际供需情况。
对于国产卡,目前正在测试寒武纪和沐曦两家公司的产品,其中沐曦C500表现较好,虽然耗电量相对NV卡较
高,其供应链稳定且价格适中,比寒武纪更具成本优势。
其中与NV卡混合使用主要基于B端客户多样化需求。
一些客户需要使用NV系列卡完成训练、微调或蒸馏任务,而其他场景可能采用寒武纪及910B等即可满足推理
要求。
因此,为适应外部项目多样性,还是需要灵活配置不同类型硬件资源。
腾讯云B端、C端总体日均模型调用量:
2024年腾讯云整体日均调用峰值超过300亿次,其中统计数据主要来源于B端客户,即腾讯云上的企业用户,而
且主要使用的是混元模型(三方开源模型调用量占比不超过
5%),C端调用量暂无准确估计。
2025年的目标是日均调用量突破1000亿次(混元仍占主导地位,调用量占比预期超过70%,后续多模态模型的
调用将成为主流),这一增长目标仍以B端客户为主导。
同时,为实现这一目标,今年新增了一些开源模型支持,例如此前在TI平台上提供的开源模型。
相应在DeepSeek模型上线后,其免费API吸引了大量用户。
例如,DeepSeek
模型上线首周单日API调用量已突破10亿次。
但由于API的不稳定性,目前该数据有所下降。
此外,在DeepSeek模型上线后一周内,其算力销售额接近2000万元人民币,同时签约购买算力的KA客户数量
已超过5000家,这种趋势表明DeepSeek对核心算力销售具有显著推动作用。
B端客户尝试使用DeepSeek模型的比例及反馈:
当前已有超过50%的B端客户尝试接入或使用DeepSeek模型,其中大约20%的客户希望进行私有化部署,这些
需求主要来自政府、金融等行业的大型KA客户,已经开始采用DeepSeek相关技术,并结合腾讯提供的平台(如
TIMetics)进行部署。
腾讯与与DeepSeek建立了合作关系:
目前尚未与DeepSeek建立正式合作关系,但内部对此持积极态度,并希望未来能够达成合作。
投资并购部门一直在关注DeepSeek的动态,当前行业内各家公司均在尝试与其接触,但由于存在一定竞争关
系,尚未形成具体的合作模
您可能关注的文档
- 太平洋证券 DeepSeek部署进度快,全面赋能经纪业务.pdf
- 万物智能演化理论对23个科学与哲学重要问题的探索性解答.pdf
- 小红书文旅行业营销解决方案.pdf
- 小红书樱花季3.0《春日樱花漫游》.pdf
- 中国2025·机器人之夜方案.pdf
- 中上协统计月报2025年01月.pdf
- 250224 可控核聚变:新一代托卡马克的建成,是实现聚变点火的重要节点.pdf
- 财务主管应如何转型才能聚信心,塑未来? -安永全球财务主管基因调查报告 202409 -EY-副本.pdf
- 电子行业2025年春季投资策略:十大科技巨头视角下AI创新永不眠-250213-开源证券-70页.pdf
- 高效人才寻源蓝图:在业务需求出现之前填补人才储备的内部秘诀.pdf
- 新视野二版听说1第6单元示范1课件.ppt
- 【参考答案】 联络口译(第二版) 《联络口译》(第二版)参考答案.pdf
- 梅大高速茶阳路段“5·1”塌方灾害调查评估报告.docx
- 虹吸雨水PE管施工节点标准做法.pdf
- 2025消防设施施工质量常见通病防治手册,典型图示+规范要求.pptx
- 新视野大学英语(第二版)读写教程 4 空军工程大学编U05B.ppt
- E英语教程2(智慧版)Unit 6.pptx
- E英语教程3(智慧版)Unit 7.ppt
- 新视野二版读写1第4单元课件Section A How to Make a Good Impression.pptx
- E英语视听说教程4(智慧版)4-U2课件(2024版)U2.pptx
文档评论(0)