- 1、本文档共46页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2025年深度行业分析研究报告;
一、DeepSeek背景介绍
1.1、DeepSeek股权结构及创始人背景
1.2、DeepSeek母公司幻方量化,早期确立AI战略为后续出圈埋下伏笔
1.3、DeepSeek重视年轻团队且兼具深厚技术底蕴,薪酬对标字节跳动研发岗1.4、DeepSeek产品家族全梳理
1.5、DeepSeek日活远超同期ChatGPT,下载量霸榜全球140个市场移动应用榜首1.6、DeepSeek获得海内外市场认可,中国AI产业首次步入引领位置
二、DeepSeek模型家族技术详解
2.1、DeepSeek模型家族技术创新框架总揽
2.2、DeepSeekv3:性能对齐海外领军闭源模型,DeepSeek2024年巅峰之作
2.3、DeepSeekR1Zero核心创新点——RL(强化学习)替代SFT(有监督微调)2.4、DeepSeekR1:高质量冷启动数据+多阶段训练,将强推理能力泛化
2.5、开源大模型:打破OpenAI等闭源模型生态,提升世界对中国AI大模型认知;
一、DeepSeek背景介绍;
1.1、DeepSeek股权结构及创始人背景
DeepSeek是一家于2023年成立的中国初创企业,创始人是AI驱动量化对冲基金幻方量化的掌门人梁文锋。从股权结构图显示,DeepSeek由四名自然人通过五层控股掌握100%股份(其中梁文锋间接持股比例83.29%,直接持股1%,累计84.2945%)。
创始人梁文锋出生于广东湛江,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位,2008年起开始带领团队使用机器学习等技术探索全自动量化交易,2015年幻方量化正式成立。2021年,幻方量化的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”之列。2023年梁文锋宣布正式进军通用人工智能领域,创办DeepSeek,专注于做真正人类级别的人工智能。;
1.2、DeepSeek母公司幻方量化,早期确立AI战略为后续出圈埋下伏笔
母公司幻方量化确立以AI为发展方向。2016年,幻方量化第一个由深度学习算法模型生成的股票仓位上线实盘交易,使用GPU进行计算。随后不久,该公司明确宣布AI为主要发展方向。
量化投资全面AI化驱动囤卡需求,为后续蜕变埋下伏笔。复杂的模型计算需求使得单机训练遭遇算力瓶颈,训练需求和有限的计算资源产生矛盾,幻方需要解决算力受限难题。于是幻方在2019年成立了一家AI基础研究公司,并推出自研的“萤火一号”AI集群,搭载500块显卡。2021年,幻方又斥资10亿元建设“萤火二号”,为AI研究提供算力支持。幻方在构建AI算力过程中的“囤卡”动作为它赢得了市场机会。作为国内早期的英伟达芯片大买家之一,2022年其用于科研支持的闲时算力高达1533万GPU时,大大超越了后来很多大模型公司。;
图:DeepSeek公开招聘职位信息汇总;
模型类别日期名称内容对标;
DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。
在具体的测试集上,DeepSeek-V3在知识类任务上接近当前表现最好的模型Claude-3.5-Sonnet-1022;长文本/代码/数学/中文能力上均处于世界一流模型位置。;
1.4.2、DeepSeek-R1性能对标OpenAIo1正式版,实现发布即上线
DeepSeek-R1性能比较OpenAI-o1。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。DeepSeekR1同步登录
文档评论(0)