网站大量收购独家精品文档,联系QQ:2885784924

DeepSeek开源手册报告.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多

朱建定DeepSeek开源⼿册(2025.2⽉22⽇版)

1、为什么DeepSeek如此⼤热?

1.1Deepseek是什么?⼀篇完全解读

这个春节,你⼀定刷到过deepseek的消息

过去⼏天,deepseek频繁登上热搜,各种分析⽂章、测评视频层出不穷。你可能还不太熟悉它,但它

已经在全球AI圈炸开了锅。

今天给⼤家⽤⼀篇攻略,深度拆解deepseek,⽤最通俗的⽅式,帮你真正⽤起来!⽆论是⽇常办

公、⾃媒体创作、AI副业,还是提升⽣活效率,DeepSeek都能帮你成为AI时代的领跑者,助你

2025年迎来AI赋能的全新⾃⼰!

作为国⼈必知的AI⼤模型之⼀,deepseek是杭州深度求索⼈⼯智能公司研发的国产AI助⼿,类似

于Kimi、⾖包,但它的核⼼优势远超⼀般AI⼯具。

你或许不知道,deepseek背后的公司成⽴才1年多,但在全球AI竞争中已经站稳了脚跟。来看时间

轴:

1.1.1Deepseek发展时间线:

2023年7⽉:DeepSeek正式成⽴,总部在杭州,由量化私募巨头幻⽅量化创⽴。

2023年11⽉2⽇:发布⾸个开源代码⼤模型DeepSeekCoder,⽀持多种编程语⾔的代码⽣成、调

试和数据分析。

2023年11⽉29⽇:推出参数规模67B的通⽤⼤模型DeepSeekLLM,⾸发包含7B和67B的

Base及Chat版本。

2024年5⽉7⽇:发布第⼆代开源混合专家(MoE)模型DeepSeek-V2,总参数2360亿,推理成

本降⾄每百万token仅1元⼈⺠币。

2024年12⽉26⽇:发布DeepSeek-V3,参数规模6710亿,采⽤MoE架构+FP8混合精度训练,

训练成本仅557.6万美元。

2025年1⽉20⽇:发布新⼀代推理模型DeepSeek-R1,性能⽐肩GPT-4o,并且完全开源。

2025年1⽉26⽇:DeepSeek登顶美区AppStore免费榜第六,超过GoogleGemini和

MicrosoftCopilot,成为全球关注焦点。

1.1.2DeepSeek背后的公司和团队

2025年2⽉2⽇,彭博社报道,DeepSeek推出的AI助⼿⻛靡全球,仅在2025年初发布后,便迅速

攀升⾄140个国家AppStore下载榜⾸,甚⾄在美国AndroidPlayStore也登顶第⼀。

这家成⽴不到两年的中国AI公司,如何在全球范内掀起浪潮?它的掌舵者⸺梁⽂锋,⼜是谁?

梁⽂锋:从数学天才到AI领军者

•1985年,出⽣于⼴东湛江,⾃⼩成绩优异,六年级便考⼊吴川⼀中,数学天赋突出。

•2002年,以“⾼考状元”⾝份考⼊浙江⼤学电⼦信息⼯程专业,后攻读信息与通信⼯程

硕⼠。

•2013年,与浙⼤校友徐进创⽴杭州雅克⽐投资管理有限公司,正式进⼊量化投资领域。

•2015年,成⽴幻⽅技(幻⽅量化),打造中国最具影响⼒的量化私募基⾦之⼀。

•2021年,幻⽅资产管理规模突破千亿,成为中国量化投资“四⼤天王”之⼀(幻⽅量

化、九坤投资、明汯投资、灵均投资)。

•2023年5⽉,38岁的梁⽂锋宣布“做AGI”(通⽤⼈⼯智能)。

•2023年7⽉,创⽴DeepSeek,投⾝AI领域。

•2025年,受邀参加国家级座谈会,并登上《新闻联播》,作为AI代表发⾔。

DeepSeek:如何在1年半内打破全球AI垄断?

DeepSeek并⾮传统AI公司,⽽是量化投资+AI技术结合的产物。幻⽅量化在数据处理、数学建模、

深度学习等领域的积累,使其天然具备AI研发优势。

核⼼突破:数据蒸馏技术

DeepSeek使⽤数据蒸馏技术,即在⼤规模数据基础上,提取更精炼、更有价值的知识,避免⽆效信

息⼲扰,使AI训练更加⾼效。

这⼀技术,使得DeepSeek训练成本远低于OpenAI,但效果却能与GPT-o1竞争。

据澎湃新闻报道,有负责⼤模型领域挖掘⾼端技⼈才的猎头表⽰,DeepSeek的⽤⼈逻辑和⼤模型

领域其他公司的⽤⼈逻辑并⽆太⼤差异,对⼈才的核⼼标

您可能关注的文档

文档评论(0)

. + 关注
实名认证
内容提供者

.

1亿VIP精品文档

相关文档