DeepSeek创始人梁文锋专访 20250201(8).pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

DeepSeek创始人梁文锋专访

Deepseek龚超整理

记者:DeepSeekV2模型发布后,迅速引发了一场大模型价格战。有人说你们是行业的一条

鲶鱼,你们是有意成为鲶鱼的吗?

梁文峰:我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。

记者:这个结果让你们意外吗?

梁文峰:非常意外。我们没想到价格让大家这么敏感。我们只是按照自己的步调来做事,然

后核算成本定价。我们的原则是不贴钱,也不赚取暴利。这个价格也是在成本之上,稍微有

点利润。

记者:5天后智谱AI就跟进了,之后是字节、阿里、百度、腾讯等大厂。智谱AI降的是

一个入门级产品,和我们同级别的模型仍然收费很贵。字节是真正第一个跟进的,旗舰模型

降到和我们一样的价格,然后触发了其他大厂纷纷降价。因为大厂的模型成本比我们高很多,

所以我们没想到会有人亏钱做这件事。最后就变成了互联网时代的烧钱补贴的逻辑。

记者:外部看来,降价很像在抢用户,互联网时代的价格战通常如此。抢用户并不是我们的

主要目的,我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一

方面也觉得无论API还是AI,都应该是普惠的,人人可以用得起的东西。

记者:在这之前,大部分中国公司都会直接copy这一代的Llama结构去做应用。为什么你

们会从模型结构切入?

梁文峰:如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们目的

地是AGI,这意味着我们需要研究新的模型结构,在有限资源下实现更强的模型能力。这是

scaleup到更大模型所需要做的基础研究之一。除了模型结构,我们还做了大量其他的研究,

包括怎么构造数据,如何让模型更像人类等,这都体现在我们发布的模型里。

记者:Llama的结构在训练效率和推理成本上,和国外先进水平估计也已有两代差距。这种

代差主要来自哪里?

梁文峰:首先训练效率有差距,我们估计国内最好的水平和国外最好的相比,模型结构和训

练动力学上可能有一倍的差距。光这一点,我们要消耗两倍的算力才能达到同样效果。另外

数据效率上可能也有一倍差距,也就是我们要消耗两倍的训练数据和算力才能达到同样的效

果。合起来就要多消耗4倍算力。我们要做的正是不停的去缩小这些差距。

记者:大部分中国公司都选择既要模型又要应用,为什么Deepseek目前选择只做研究探索?

1

梁文峰:因为我们觉得现在最重要的是参与到全球创新的浪潮里去。过去很多年,中国公司

习惯了别人做技术创新,我们拿过来做应用变现。但这并非是一种理所当然。这一波浪潮里,

我们的出发点就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。

记者:互联网和移动互联网时代,留给大部分人的惯性认知识是,美国擅长搞技术创新,中

国更擅长做应用。我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。

过去30多年,IT浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律

从天而降,躺在家里18个月,就会出来更好的硬件和软件。ScalingLaw也在被如此对待。

但其实这是西方主导的技术社区一代代孜孜不倦创造出来的。只因为之前我们没有参与这个

过程,以至于忽视了它的存在。

记者:为什么DeepSeekV2会让硅谷的很多人惊讶?

梁文峰:在美国每天发生的大量创新里,这是非常普通的一个。他们之所以惊讶,是因为这

是一个中国公司,在以创新贡献者的身份加入到他们游戏里去。毕竟大部分中国公司习惯

follow,而不是创新。但这种选择放在中国语境里,也过于奢侈。大模型是一个重投入游戏,

不是所有公司都有资本只去研究创新,而不是先考虑商业化。

记者:创新的成本肯定不低,过去那种拿来主义的惯性也和过去的国情有关。但现在你看,

无论中国的经济体量还是字节、腾讯这些大厂的利润放在全球都不低。我们创新缺的肯定不

是资本,而是缺乏信心,以及不知道怎么组织高密度的人才,实现有效的创新。

记者:为什么中国公司,包括不缺钱的大厂,这么容易

您可能关注的文档

文档评论(0)

Zeng + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2025年05月30日上传了教师资格证

1亿VIP精品文档

相关文档