- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
DeepSeek研究框架
——计算机人工智能系列深度报告
评级:推荐(维持);
相关报告;
DeepSeek引领全球AI创新,一定程度上也影响了全球AI格局,并提振了国内AI产业信心。我们看好由DeepSeek带来的AI产业、尤其是国内AI产业的发展机遇,包括AI应用、端侧AI、算力等三个方向。
uDeepSeek(深度求索)专注大模型技术,V3和R1模型惊艳海内外
DeepSeek(深度求索)成立于2023年7月,由量化资管公司幻方量化创立,DeepSeek专注于开发先进的大语言模型(LLM)和相关技术。2024年1月5日,发布第一个大模型DeepSeekLLM;12月26日,上线DeepSeek-V3并同步开源,DeepSeek-V3采用FP8训练,性能对其世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet。2025年1月20日,发布DeepSeek-R1,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。DeepSeek-R1推出后广受关注,据Appfigures、SensorTower报告,1月26日以来,深度求索 (DeepSeek)发布的DeepSeekAI智能助手爆火,在全球140个市场的应用商店下载榜上排名第一。
DeepSeekV3和R1模型基于Transformer架构,采用了MLA和DeepSeekMoE两大核心技术,引入了多令牌预测、FP8混合精度训练等创新技术,显著提升了模型的训练效率和推理性能。DeepSeek创始人梁文锋表示“V2模型没有海外回来的人,都是本土的”。DeepSeek代表中国本土AI大模型,也代表开源AI走在了全球AI市场的前列。
uDeepSeek对全球AI行业影响颇深:激发创新、提振国产、推广开源
1)DeepSeek成为了全球AI的一条“鲶鱼”。DeepSeek发布或导致全球AI格局变化,中美AI形势生变,全球AI被“鲶鱼”激活。预计美系AI会不断反应,全球AI模型迭代和发布频率将提速,投入继续加大。自1月20日DeepSeek-R1发布以来,OpenAI连续发布了Agentoperator,O3mini、DeepResearch等模型,OpenAICEO表示GPT-5将是超级混合模型,计划把GPT和o系列模型整合在一起。
2)DeepSeek驱动国产AI估值重塑。我们认为:长期以来,算力和技术是制约国内AI估值的主要因素,DeepSeek在国内AI芯片受限的环境里,通过本土AI团队,探索出一条“算法创新+有限算力”的新路径,较大地提振了国内AI产业信心。DeepSeek-R1的推出或同时打破了抑制国产AI产业的技术和算力这两项天花板,将驱动国产AI软件硬件迎估值重塑。
3)DeepSeek是开源AI的“ChatGPT时刻”。OpenAICEO首次承认OpenAI的闭源策略“站在了历史错误的一边”。DeepSeek-R1开源将会吸引更多人参与到大模型研发中,并通过蒸馏等技术显著提升推理AI、小模型的性能,将大幅加速全球AI创新,加速AI推理进程,普惠AI、AI平权将驱动DeepSeek迅速推广,近期全球CSP大厂密集上架DeepSeek能力也验证了这点,我们预计KillerAPP的诞生或将临近。;
uDeepSeek推动AGI时代到来,关注AI应用、端侧AI、算力三大主线
1)AI应用:DeepSeek的创新带来成本极致优化,带来AI普惠、AI平权,将加速AI应用的创新,国内AI应用将受益于DeepSeek实现能力显著提升,应用上游的模型API的价格下降也将驱动应用厂商的商业模式快速成熟。
2)AI端侧:DeepSeek支持用户进行“模型蒸馏”,并通过DeepSeek-R1的输出,蒸馏了6个小模型开源给社区。端侧AI能力过去受限于端侧AI计算影响,DeepSeek将显著提升端侧小模型的能力,进而提升AI终端能力。
3)算力:杰文斯悖论指出当我们希望通过技术进步来提高资源效率时,可能会导致资源的消耗增加。我们预计DeepSeek带来的大模型推理成本的优化,将加速AI的普及推广,和下游应用的商业模式构建,并推动AI算力进入由终端用户需求驱动的长增长周期。
u投资建议
DeepSeek探索出一条“算法创新+有限算力”的新路径,开源A
您可能关注的文档
最近下载
- 云仓项目规划方案.pdf VIP
- 毕业设计(论文)-基于51单片机的超声波测距倒车雷达.doc VIP
- 湖北省武汉市青山区2023—2022学年度五年级上册语文期末测试试卷PDF版,含答案.docx VIP
- 医疗器械监督管理条例.pptx VIP
- 2025-2030年碱木质素公司技术改造及扩产项目可行性研究报告.docx
- 高危低钾血症患者加速治疗专家共识(东湖共识).pptx VIP
- 中建EPC项目前期策划及设计管理全过程要点.pdf VIP
- CTD格式申报资料--模块2 2.4.CAR-T细胞的非临床概述.docx VIP
- 品管圈QCC成果汇报之降低中心静脉导管堵管率护理课件.pptx VIP
- 医院党支部医德医风建设专题党课讲稿PPT:修医德正医风 守护生命之光.pptx VIP
文档评论(0)